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内 容 提要 


本 书 是 一 本 基于 CHI 新 标准 的 并 发 和 多 线程 编程 深度 指南 。 内 容 包 括 std:thread, 
std:mutex. std::future 和 std::async 等 基础 类 的 使 用 ， 内 存 模型 和 原子 操作 、 基于 锁 和 无 锁 
数据 结构 的 构建 ， 以 及 并 行 算法 和 线程 管理 ， 最 后 还 介绍 了 多 线程 代码 的 测试 。 本 书 的 附 
录 部 分 还 对 C++11 新 语言 特性 中 与 多 线程 相关 的 项 目 进行 了 简要 的 介绍 ， 并 提供 了 C++11 
线程 库 的 完整 参考 。 

本 书 适 合 于 需要 深入 了 解 C++ 多 线程 开发 的 读者 , 以 及 使 用 C++ 进行 各 类 软件 开发 
的 开发 人 员 、 测 试 人 员 阅 读 。 使 用 第 三 方 线程 库 的 读者 ， 也 可 以 从 本 书后 面 的 章节 中 了 
解 到 相关 的 指引 和 技巧 。 同 时 ， 本 书 还 可 以 作为 CH1 线程 库 的 参考 工具 书 。 


序 


我 是 在 离开 大 学 后 的 第 一 份 工作 中 遇 到 多 线程 编程 的 概念 的 。 我 们 当时 在 编写 一 个 
数据 处 理应 用 程序 ， 它 需要 用 传人 的 数据 记录 来 填充 数据 库 。 虽 然 数据 很 多 ， 但 每 个 数 
据 都 是 独立 的 ， 并 且 在 它 被 插入 数据 库 前 需要 大 量 的 处 理 。 为 了 充分 利用 10-CPU 
UltraSPARC 的 能 力 ， 我 们 在 多 线程 中 运行 代码 ， 让 每 个 线程 处 理 它们 自己 的 一 组 输入 
数据 。 在 这 个 过 程 中 ， 我 们 用 C++ 编写 代码 ， 使 用 POSIX 线程 ， 并 且 犯 了 相当 多 的 错 
误 。 尽管 多 线程 对 我 们 而 言 都 是 全 新 的 ， 但 我 们 最 终 还 是 完成 了 。 正 是 在 这 个 项 目 中 的 
工作 ， 我 第 一 次 了 解 了 C++ 标准 委员 会 和 全 新 发 布 的 C++ 标准 。 

我 对 多 线程 和 并 发 有 前 所 未 有 的 兴趣 。 虽 然 别 人 认为 它 困难 、 复 杂 ， 是 问题 之 源 ， 
但 我 却 视 它 为 强大 的 工具 ， 因 为 它 可 以 允许 你 利用 现 有 的 硬件 让 代码 运行 得 更 快 。 随 后 
我 了 解 到 它 即 便 是 在 单 核 硬件 上 也 能 提高 应 用 程序 的 响应 和 性 能 ,通过 使 用 多 线程 来 隐 
藏 诸如 IO 这 样 耗费 时 间 的 操作 延迟 。 我 还 了 解 了 它 怎 样 在 OS 级 别 工作 以 及 Intel CPU 
如 何 处 理 任 务 切 换 。 

同时 , 我 对 C++ 的 兴趣 给 我 带 来 了 与 ACCU 以 及 BSI 的 C++ 标准 专家 组 以 及 Boost 
接触 的 机 会 。 我 赁 兴趣 跟 进 了 Boost 线程 库 的 初期 开发 ， 当 它 被 最 初 的 开发 者 抛弃 时 ， 
我 便 趁 机 介 人 和 人 了。 我 从 此 成 为 了 Boost 线程 库 最 主要 的 开发 者 和 维护 者 。 

当 C++ 标准 委员 会 的 工作 从 修正 现 有 标准 的 缺陷 转移 到 编写 下 一 代 标 准 (希望 在 
2009 年 之 前 完成 故 命名 为 CHt+0x， 现 在 正式 为 CH+11， 因 为 最 终 发 布 于 2011 年 ) 的 提 
案 后 ， 我 更 多 地 参与 到 BSI 并 且 开 始 起 草 我 自己 的 提案 。 多 线程 刚 被 明确 地 提 上 议事 日 
E, 我 就 全 力 以 赴 地 投入 进去 , 并 且 撰 写 或 共同 撰写 了 许多 与 多 线程 和 并 发 相关 的 提案 ， 
它们 组 成 了 新 标准 的 一 部 分 。 我 感到 很 荣幸 ， 可 以 有 这 个 机 会 用 这 种 方式 组 合 我 的 计算 
机 相关 的 两 大 兴趣 一 一 C++ 和 多 线程 。 

这 本 书 借鉴 了 我 在 C++ 和 多 线程 上 的 全 部 经 验 , 其 目标 是 教会 其 他 C++ 开发 者 如 何 
安全 并 有 效 地 使 用 C++11 线程 库 。 我 也 希望 能 顺带 传授 一 些 我 在 这 方面 的 热情 。 
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我 要 首先 对 我 的 妻子 Kim 说 一 声 “ 谢 谢 ”， 感 谢 在 我 写 这 本 书 的 时 候 她 给 我 的 爱 和 
支持 。 写 书 占用 了 我 最 近 4 年 很 多 的 空闲 时 间 ， 没 有 她 的 耐心 、 支 持 和 理解 ， 我 不 可 能 
做 到 。 

其 次 , 我 想 感谢 Manning 的 团队 , 包括 总 编 Marjan Bace、 副 总 编 Michael Stephens、 
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Tennant 和 制作 经 理 Mary Piergies。 他 们 使 得 这 本 书 成 功 面世 ， 没 有 他 们 的 努力 ， 你 现 
在 就 读 不 到 这 本 书 了 。 

我 还 想 感谢 C+ 标准 委员 会 的 其 他 成 员 ， 他 们 为 多 线程 工具 上 撰写 了 文件 。 正 是 
Andrei Alexandrescu, Pete Becker, Bob Blainer, Hans Boehm, Beman Dawes, Lawrence 
Crowl, Peter Dimov, Jeff Garland, Kevlin Henney, Howard Hinnant, Ben Hutchings, 
Jan Kristofferson, Doug Lea, Paul McKenney, Nick McLaren, Clark Nelson, Bill Pugh, 
Raul Silvera, Herb Sutter, Detlef Vollmann 和 Michael Wong, 以 及 所 有 在 文件 上 批注 
的 人 们 ， 他 们 在 委员 会 会 议 上 进行 了 讨论 ， 还 有 其 他 人 的 帮助 才 形成 了 C++11 中 的 多 
线程 和 并 发 支持 。 

最 后 ， 我 还 想 感谢 下 面 的 人 :Dr Jamie Allsop, Peter Dimov, Howard Hinnant, 
Rick Molloy、Jonathan Wakely 和 Dr Russel Winder， 他 们 的 建议 极 大 地 改进 了 这 本 书 。 
另外 特别 感谢 Russel 的 详细 审阅 ， 还 有 技术 校对 Jonathan， 在 编辑 出 版 过 程 中 极其 用 
心地 检查 了 终 稿 中 所 有 内 容 中 的 错误 (当然 所 有 的 错误 都 是 由 我 造成 的 )。 此 外 我 想 感 
谢 我 的 审 稿 专家 组 : Ryan Stephens, Neil Horlock, John Taylor Jr., Ezra Jivan、Joshua 
Heyer, Keith S. Kim, Michele Galli, Mike Tian-Jian Jiang, David Strong, Roger Orr, 
Wagner Rick, Mike Buksas 和 Bas Vodde。 还 要 谢谢 MEAP 版 的 读者 ， 他 们 花费 时 间 来 
指出 错误 或 是 强调 了 需要 阐明 的 部 分 。 
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这 本 书 是 对 新 CH 标准 中 的 并 发 和 多 线程 工具 的 深度 指南 , 内 容 包括 从 std: :thread、 
std: :mutex 和 std: :async 的 基本 用 法 ， 到 复杂 的 原子 操作 与 内 存 模型。 


路 线 图 

前 4 章 介 绍 了 由 类 库 提 供 的 各 种 类 库 工具 以 及 他 们 如 何 使 用 。 

第 5 章 涵 盖 了 内 存 模型 和 原子 操作 的 低 阶 基础 , 包括 原子 操作 怎样 在 其 他 代码 上 强 
制 实行 排序 约束 ， 并 标志 着 导言 章节 的 结束 。 

第 6 章 和 第 7 章 开始 涵盖 高 阶 的 论题 , 包括 一 些 如 何 使 用 基础 工具 来 构造 更 复杂 的 
数据 结构 的 示例 一 第 6 章 中 基于 锁 的 数据 结构 ， 以 及 第 7 章 中 无 锁 的 数据 结构 。 

第 8 章 继续 高 阶 论题 ， 包 括 如 何 设计 多 线程 代码 的 指南 ， 涵 盖 了 影响 性 能 的 论点 ， 
以 及 各 种 并 行 算法 的 示范 实现 。 

第 9 章 涵盖 了 线程 管理 一 一 线程 池 、 工 作 队列 和 中 断 操 作 。 

第 10 章 包 括 了 测试 和 调试 一 -bug 的 类 型 ， 定 位 它们 的 技巧 ， 如 何 测试 它们 ， 
等 等 。 

附件 包含 了 对 由 新 标准 引入 的 与 多 线程 相关 的 一 些 新 语言 工具 的 简要 介绍 , 第 4 章 
中 提 到 的 消息 传递 库 的 具体 实现 ， 以 及 C++11 线程 库 的 完整 参考 。 


谁 应 该 阅读 本 书 
如 果 你 打算 用 C+ 编写 多 线程 代码 ,你 就 应 该 阅读 本 书 。 如 果 你 正 要 使 用 C++ 标准 
库 中 新 的 多 线程 工具 ， 这 本 书 是 必 备 的 指南 。 如 果 你 正 使 用 兰 代 的 线程 库 ， 后 面 几 章 中 
的 指引 和 技巧 应 该 也 是 有 用 的 。 
假设 你 对 C++ 已 经 有 了 很 好 的 了 解 ， 但 对 新 的 语言 特性 却 不 其 熟悉， 这 些 在 附录 A 
中 也 能 找到 答案 。 假 定 你 之 前 没有 多 线程 编程 的 知识 和 经 验 ， 那 就 更 应 该 阅读 本 书 。 


如 何 使 用 本 书 

如 果 你 以 前 从 未 写 过 多 线程 代码 ， 我 建议 你 按 顺 序 从 头 到 尾 阅读 本 书 ， 可 以 跳 过 第 
5 章 中 的 细节 部 分 ， 但 第 7 章 大 量 依赖 第 5 章 中 的 材料 ， 所 以 如 果 你 跳 过 了 第 5 章 ， 你 
一 定 要 阅览 第 7 章 ， 除 非 你 曾 读 过 。 

如 果 你 之 前 未 曾 使 用 过 C++11 语言 工具 , 在 你 开始 确定 准备 快速 开始 书 中 例子 之 前 
最 好 浏览 一 下 附录 A。 新 语言 工具 的 使 用 凸显 在 文字 之 中 ,然而 ， 当 你 遇 到 了 之 前 没有 
见 过 的 东西 时 ， 总 是 可 以 翻 看 附录 的 。 

如 果 你 在 其 他 环境 中 拥有 大 量 编写 多 线程 代码 的 经 验 , 开始 的 几 章 可 能 让 你 值得 浏 
览 一 遍 ， 以 便 你 可 以 看 看 你 了 解 的 工具 怎样 映射 到 新 C++ 标准 中 。 如 果 你 打算 用 原子 变 
量 做 一 些 低 阶 的 工作 , 第 5 章 就 是 必需 的 。 为 了 确认 你 熟悉 多 线程 Ct+ 中 类 似 异 常安 全 
的 东西 ， 值 得 阅览 一 下 第 8 章 。 如 果 你 在 脑海 中 有 特定 的 任务 ,索引 和 目录 可 以 帮助 你 
快速 找到 相关 的 章节 。 

一 旦 你 打算 促进 C++ 线程 库 的 使 用 ,附录 D 应 该 仍然 有 用 ， 比 如 查询 每 个 类 和 函数 
调用 的 细节 。 你 可 能 会 想 一 次 又 一 次 地 翻 回 主 章节 ， 来 刷新 你 对 某 一 概念 的 使 用 或 者 看 
一 看 示例 代码 。 


代码 约定 和 下 载 
所 有 代码 清单 和 正文 中 的 源 代码 ， 出 现 等 宽 字 体 (like this)， 是 为 了 便于 从 常 
规 文本 中 区 分 出 来 。 代 码 注解 伴随 着 很 多 清单 ， 指 出 重要 的 概念 。 在 有 些 情况 下 ， 数 字 
符号 往往 指向 清单 后 面 的 注释 。 
本 书 中 所 有 的 工作 示例 源 代码 可 以 在 出 版 社 网 址 下 载 ，www.manning.com/ 


CPlusPlusConcurrencyinAction, 


软件 需求 
为 了 直截了当 地 使 用 本 书 中 的 代码 ， 你 需要 一 个 最 新 的 C++ 编译 器 ， 它 支持 示例 中 
使 用 的 新 的 Ct+11 语言 特性 (参见 附录 A)， 并 且 你 需要 C++ 标准 线程 库 的 副本 。 
在 撰写 本 书 的 时 候 ，8g++ 是 我 所 知道 的 唯一 带 有 标准 线程 库 实 现 的 编译 器 ， 尽 管 
Microsoft Visual Studio 2011 预览 版 也 包括 了 实现 。 线 程 库 的 g++ 实 现 最 早 是 在 g++ 4.3 
中 引入 了 基本 形式 ， 并 且 在 后 来 的 版 本 中 进行 了 扩展 。g++ 4.3 也 引入 了 一 些 新 C++11 
语言 特性 的 初次 支持 ;对 新 语言 特性 更 多 的 支持 在 各 个 后 续 版 本 中 ,详情 参见 g++ C++11 
状态 页 面 。 
Microsoft Visual Studio 2010 提供 了 一 些 新 C++11 语言 特性 ,例如 右 值 引用 和 1lambda 


! GNU Compiler Collection C++0x/C++11 状态 页 面 ，http://gcc.gnu.org/projects/cxxOx.html。 


函数 ， 但 并 不 带 有 线程 库 的 实现 。 

作者 的 公司 Just Soft Solutions Ltd, H Bi y Microsoft Visual Studio 2005, Microsoft 
Visual Studio 2008 , Microsoft Visual Studio 2010 和 g++ 的 各 种 版 本 设计 的 C++11 标准 线 
程 库 的 完整 实现 。 这 些 实现 已 被 用 来 测试 本 书 中 的 示例 。 

Boost 线程 库 -提供 了 基于 C++ 标准 线程 库 提案 的 API, 可 以 移植 到 许多 平台 。 本 书 
中 的 大 部 分 示例 可 以 通过 审慎 地 将 sca: :着 换 成 boost: : 进行 修改 ， 并 使 用 适当 的 
include 指令 ， 来 与 Boost 线程 库 一 起 工作 。 在 Boost 线程 库 中 有 少数 工具 不 受 支 持 
(比如 std: :async) 或 者 拥有 不 同 的 名 称 (比如 boost: :unique future), 


| 作者 在 线 
i 购买 C++ Concurrency in Action 包括 了 免费 访问 由 Manning 出 版 社 运营 的 私有 网 络 论坛 ， 
在 这 里 你 可 以 对 本 书 做 出 评论 ， 提 问 技术 问题 ， 并 且 从 作者 和 其 他 用 户 那 里 得 到 帮助 。 如 采 
要 访问 此 论坛 并 订阅 它 ， 可 以 访问 网 址 www.manning.com/CPlusPlusConcurrencyinAction, % 
页 面 提供 了 论坛 的 使 用 指南 以 及 论坛 上 的 行为 规则 。 
| Manning 对 我 们 读者 的 承诺 是 提供 一 个 场所 ， 在 这 里 每 个 读者 之 间 以 及 读者 和 作者 
| 之 间 可 以 进行 有 意义 的 对 话 。 就 作者 而 言 并 没有 承诺 任何 规定 的 参与 量 ， 作者 对 本 书 论 
| 坛 的 贡献 只 是 义务 的 〈 且 无 偿 的 )。 我 们 建议 你 试 着 向 作者 提问 一 些 有 挑战 性 的 问题 ， 
以 免 他 失去 兴趣 ! 

作者 在 线 论坛 以 及 过 往 讨论 的 归档 ， 在 本 书 在 印 期 间 都 可 以 从 出 版 社 网 站 进行 
| 访问 。 
| 
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这 是 令 C++ 用 户 振奋 的 时 刻 。 距 1998 年 初始 的 C++ 标准 发 布 13 年 后 ，C++ 标 准 委 
员 会 给 予 程序 语言 和 它 的 支持 库 一 次 重大 的 变革 。 新 的 C++ 标准 (也 被 称 为 C++11 或 
CHHOx) 于 2011 年 发 布 并 带 来 了 很 多 的 改变 ， 使 得 C++ 的 应 用 更 加 容易 并 富有 成 效 。 

在 CH+11 标准 中 一 个 最 重要 的 新 特性 就 是 支持 多 线程 程序 。 这 是 C++ 标准 第 一 次 在 
语言 中 承认 多 线程 应 用 的 存在 ， 并 在 库 中 为 编写 多 线程 应 用 程序 提供 组 件 。 这 将 使 得 在 
不 依赖 平台 相关 扩展 下 编写 多 线程 C+ 程序 成 为 可 能 , 从 而 允许 以 有 保证 的 行为 来 编写 
可 移植 的 多 线程 代码 。 这 也 恰 逢 程序 员 寻 求 更 多 普遍 的 并 发 ， 特 别 是 多 线程 程序 ， 来 提 
高 应 用 程序 的 性 能 。 

这 本 书 讲述 的 就 是 C++ 编程 中 对 多 线程 并 发 的 使 用 , 以 及 相关 的 C++ 语言 特性 和 库 
工具 。 我 会 以 解释 并 发 和 多 线程 的 含义 以 及 为 什么 要 在 应 用 程序 中 使 用 并 发 开始 。 在 快 
速 全 方位 地 阐述 为 什么 在 应 用 程序 中 会 不 使 用 并 发 之 后 , 我 会 对 C++ 中 并 发 支持 进行 概 
yk, 并 以 一 个 简单 的 C++ 并 发 实例 结束 这 一 章 。 具 有 开发 多 线程 应 用 程序 经 验 的 读者 可 
以 跳 过 前 面 的 小 节 。 在 随后 几 章 将 会 涵盖 更 多 广泛 的 例子 ， 并 且 更 深入 地 了 解 库 工具 。 


2 第 1 章 你 好 ，C++ 并 发 世界 


本 书 最 后 附 有 对 多 线程 与 并 发 全 部 的 C++ 标准 库 工 具 的 深入 参考 。 
那么 ,什么 是 并 发 (concurrency〉 和 多 线程 (multithreading) ? 


11 什么 是 并 发 


在 最 简单 和 最 基本 的 层面 ， 并 发 是 指 两 个 或 更 多 独立 的 活动 同时 发 生 。 并 发 在 生活 
中 随处 可 见 。 我 们 可 以 一 边 走路 一 边 说 话 ， 也 可 以 两 只 手 同时 做 不 同 的 动作 ， 还 有 我 们 
每 个 人 都 相互 独立 地 过 我 们 的 生活 一 一 我 在 游泳 的 时 候 你 可 以 看 球赛 ， 等 等 。 


1.1.1 计算 机 系统 中 的 并 发 


当 我 们 提 到 计算 机 术语 的 “并 发 "， 指 的 是 在 单个 系统 里 同时 执行 多 个 独立 的 活动 ， 
而 不 是 顺序 地 或 是 一 个 接 一 个 地 。 这 并 不 是 一 种 新 的 现象 ， 多 任务 操作 系统 通过 任务 切 
换 允 许 一 台 计 算 机 在 同一 时 间 运 行 多 个 应 用 程序 已 司空 见 惯 多 年 ,一些 高 端的 多 任务 处 
理 服务 器 实现 并 发 控制 的 历史 更 久远 。 真正 有 新 意 的 是 增加 计算 机 真正 并 行 运行 多 任务 
的 普遍 性 ， 而 不 只 是 给 人 这 种 错觉 。 

以 前 ， 大 多 数 计 算 机 都 有 一 个 处 理 器 ， 具 有 单个 处 理 单元 或 核心 ， 至 今 许多 台式 机 
器 仍 是 这 样 。 这 种 计算 机 在 某 一 时 刻 只 可 以 真正 执行 一 个 任务 ， 但 它 可 以 每 秒 切 换 任务 
许多 次 。 通 过 做 一 点 这 个 任务 然后 再 做 一 点 别 的 任务 ， 看 起 来 像 是 任务 在 并 行 发 生 。 这 
就 是 任务 切换 (task switching)。 我 们 仍然 将 这 样 的 系统 称 为 并 发 (concurrency)， 因 
为 任务 切换 得 太 快 ， 以 至 于 无 法 分 辨 任务 在 何 时 会 被 暂 挂 而 切换 到 另 一 个 任务 。 任 务 切 
换 给 用 户 和 应 用 程序 本 身 造成 了 一 种 并 发 的 假象 。 由 于 这 只 是 并 发 的 假象 ， 当 应 用 程序 
执行 在 单 处 理 器 任务 切换 环境 下 ， 与 在 真正 的 并 发 环境 下 执行 相 比 ， 其 行为 还 是 有 着 微 
妙 的 不 同 。 特 别 地 ， 对 内 存 模 型 不 正确 的 假设 (参见 第 5 章 ) 在 这 样 的 环境 中 可 能 不 会 
出 现 。 这 将 在 第 10 章 中 作 深入 讨论 。 

包含 多 个 处 理 器 的 计算 机 用 于 服务 器 和 高 性 能 计算 任务 已 有 多 年 , 现在 基于 单个 芯 
片上 具有 多 于 一 个 核心 的 处 理 器 (多 核心 处 理 器 ) 的 计算 机 也 成 为 越 来 越 常见 的 台式 机 
上 器。 无 论 它们 拥有 多 个 处 理 器 或 一 个 多 核 处 理 器 (或 两 者 兼 具 ) ， 这 些 计 算 机 能 够 真正 
的 并 行 运行 超过 一 个 任务 。 我 们 才 称 之 为 硬件 并 发 (hardware concurrency), 

图 1.1 显示 了 一 个 计算 机 处 理 恰好 两 个 任务 时 的 理想 情景 ， 每 个 任务 被 分 为 10 个 相等 
大 小 的 块 。 在 一 个 双核 机 器 (具有 两 个 处 理 核心 ) 中 ， 每 个 任务 可 以 在 各 自 的 核心 执行 。 
在 单 核 机 器 上 做 任务 切换 时 ， 每 个 任务 的 块 交织 进行 。 但 它们 也 隔 开 了 一 位 (图 中 所 示 灰 
色 分 隔 条 的 厚度 大 于 双核 机 器 的 分 隔 条 ) 。 为 了 实现 交替 进行 ， 该 系统 每 次 从 一 个 任务 切换 
到 另 一 个 时 都 得 执行 一 次 上 下 文 切换 (context switch)， 而 这 是 需要 时 间 的 。 为 了 执行 上 
下 文 切换 ， 操 作 系 统 必须 为 当前 运行 的 任务 保存 CPU 的 状态 和 指令 指针 ， 算 出 要 切换 到 哪 
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个 任务 ， 并 为 要 切换 到 的 任务 重新 加 载 处 理 器 状态 。 然 后 CPU 可 能 要 将 新 任务 的 指令 和 数 
据 的 内 存 载 人 到 缓存 中 ， 这 可 能 会 阻止 CPU 执行 任何 指令 ， 造 成 进一步 的 延迟 。 


双核 


单 核 


1.1 并 发 的 两 种 方式 ， 双 核 机 器 的 并 行 执行 对 比 单 核 机 器 的 任务 切换 


尽管 硬件 并 发 的 可 用 性 在 多 处 理 器 或 多 核 系统 上 更 显著 ， 有 些 处 理 器 却 可 以 在 一 个 
核心 上 执行 多 个 线程 。 要 考虑 的 最 重要 的 因素 是 硬件 线程 (hardware threads) 的 数量 ;: 
即 硬件 可 以 真正 并 发 运行 多 少 独立 的 任务 。 即 便 是 具有 真正 硬件 并 发 的 系统 ， 也 很 容易 
有 超过 硬件 可 并 行 运行 的 任务 要 执行 ， 所 以 在 这 些 情况 下 任务 切换 仍 将 被 使 用 。 例 如 ， 
在 一 个 典型 的 台式 计算 机 上 可 能 会 有 几 百 个 的 任务 在 运行 ， 执 行 后 台 操 作 ， 即 使 计算 机 
在 名 义 上 是 空闲 的 。 正 是 任务 切换 使 得 这 些 后 台 任 务 可 以 运行 ， 并 使 得 你 可 以 同时 运行 
文字 处 理 器 、 编 译 器 、 编 辑 器 和 web 浏览 器 (或 任何 应 用 的 组 合 ) 。 图 1.2 显示 了 四 个 
任务 在 一 台 双 核 机 器 上 的 任务 切换 ， 仍 然 是 将 任务 整齐 地 划分 为 同等 大 小 块 的 理想 情 
况 。 实 际 上 , 许多 因素 造成 了 分 割 不 均 和 调度 不 规则 。 这 些 因素 中 的 一 部 分 将 涵盖 在 第 
8 章 中 ， 那 时 我 们 再 来 看 一 看 影响 并 行 代码 性 能 的 因素 。 


双核 


图 1.2 ”四 个 任务 在 两 个 核心 之 间 的 切 


所 有 的 技术 、 功 能 和 本 书 所 涉及 的 类 都 可 以 使 用 ， 无论 你 的 应 用 程序 是 在 单 核 处 理 
器 还 是 多 核 处 理 器 上 运行 ， 也 不 管 是 任务 切换 或 是 真正 的 硬件 并 发 。 但 你 可 以 想象 ， 如 
何在 你 的 应 用 程序 中 使 用 并 发 很 大 程度 上 取决 于 可 用 的 硬件 并 发 ,这 将 在 第 8 章 中 涵 瘟 ， 
在 第 8 章 我 们 具体 研究 C++ 代码 并 行 设计 问 题 。 


1.1.2 ”并 发 的 途径 


想象 下 两 个 程序 员 一 起 做 一 个 软件 项 目 。 如 果 你 的 开发 人 员 在 独立 的 办 公 室 , E 
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们 可 以 各 自 平静 地 工作 ， 而 不 会 互相 干扰 ， 并 且 他 们 各 有 自己 的 一 套 参 考 手册 。 然 而 ， 
沟通 起 来 就 不 那么 直接 了 ， 不 能 转身 然后 互相 交谈 ， 他 们 必须 用 电话 、 电 子 邮件 或 走 到 
对 方 的 办 公 室 。 同 时 ， 你 需要 掌控 两 个 办 公 室 的 开销 ， 还 要 购买 多 份 参考 手册 。 

现在 想象 一 下 把 开发 人 员 移 到 同一 间 办 公 室 。 他 们 现在 可 以 地 相互 交谈 来 讨论 应 用 
程序 的 设计 ， 他 们 也 可 以 很 容易 地 用 纸 或 白板 来 绘制 图 表 ， 辅助 阐释 设计 思路 。 你 现在 
只 有 一 个 办 公 室 要 管理 ， 只 要 一 组 资源 就 可 以 满足 。 消 极 的 一 面 是 ， 他 们 可 能 会 发 现 难 
以 集中 注意 力 ， 并 且 还 可 能 存在 资源 共享 的 问题 (“参考 手册 跑 哪 去 了 ? “)。 

组 织 开 发 人 员 的 这 两 种 方法 代表 着 并 发 的 两 种 基本 途径 。 每 个 开发 人 员 代表 一 个 线 
程 ， 每 个 办 公 室 代表 一 个 处 理 器 。 第 一 种 途径 是 有 多 个 单线 程 的 进程 ， 这 就 类 似 让 每 个 
开发 人 员 在 他 们 自己 的 办 公 室 ， 而 第 二 种 途径 是 在 单一 进程 里 有 多 个 线程 ， 这 就 类 似 在 
同一 个 办 公 室 里 有 两 个 开发 人 员 。 你 可 以 随意 进行 组 合 ， 并 且 拥 有 多 个 进程 ， 其 中 一 些 
是 多 线程 的 ， 一 些 是 单线 程 的 ， 但 原理 是 一 样 的 。 让 我 们 在 一 个 应 用 程序 中 简要 地 看 一 
看 这 两 种 途径 。 


1. 多 进程 并 发 


在 一 个 应 用 程序 中 使 用 并 发 的 第 一 种 方法 ， 是 将 应 用 程序 分 为 多 个 、 独 立 的 、 单 线 
程 的 进程 ， 它 们 运行 在 同一 时 刻 ， 就 像 你 可 以 同时 进行 网 页 浏览 和 文字 处 理 。 这 些 独立 
的 进程 可 以 通过 所 有 常规 的 进程 间 通信 渠道 互相 传递 信息 
(信号 、 套 接 字 、 文 件 、 管 道 等 )， 如 图 1.3 所 示 。 有 一 个 缺 
扩 是 这 种 进程 之 间 的 通信 通常 设置 复杂 , 或 是 速度 较 慢 , 或 
两 者 兼备 ， 因 为 操作 系统 通常 在 进程 间 提供 了 大 量 的 保护 ， 
以 避免 一 个 进程 不 小 心 修改 了 属于 另 一 个 进程 的 数据 。 另 一 
个 缺点 是 运行 多 个 进程 所 需 的 固有 的 开销 : 启动 进程 需要 时 
间 ， 操 作 系 统 必须 投入 内 部 资源 来 管理 进程 ， 等 等 。 

当然 , 也 并 不 全 是 缺点 ; 操作 系统 在 线程 间 提供 的 附加 
保护 操作 和 更 高 级 别 的 通信 机 制 , 意味 着 可 以 比 线程 更 容易 
地 编写 安全 的 并 发 代码 。 事实 上 , 类 似 于 为 Erlang 编程 语言 —— i 
提供 的 环境 ， 可 使 用 进程 作为 重大 作用 并 发 的 基本 构造 块 。 ”图 1.3 一 对 并 发 运行 的 

使 用 独立 的 进程 实现 并 发 还 有 一 个 额外 的 优势 一 一 你 进程 之 间 的 通信 
可 以 通过 网 络 连 接 的 不 同 的 机 器 上 运行 独立 的 进程 。 虽然 这 增加 了 通信 成 本 ,但 在 一 个 
精心 设计 的 系统 上 ， 它 可 能 是 一 个 提高 并 行 可 用 行 和 提高 性 能 的 低 成 本 方法 。 


2. 多 线程 并 发 


并 发 的 男 一 个 途径 是 在 单个 进程 中 运行 多 个 线程 。 线 程 很 像 轻 量 级 的 进程 每 个 线 
程 相互 独立 运行 ， 且 每 个 线程 可 以 运行 不 同 的 指令 序列 。 但 进程 中 的 所 有 线程 都 共享 相 
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1.2.1 


免 问题 而 要 遵循 的 准则 在 本 书 中 都 有 涉及 ， 特 别 是 在 第 
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同 的 地 址 空间 , 并 且 从 所 有 线程 中 访问 到 大 部 分 数据 一 一 全 局 变量 仍然 是 全 局 的 , 指针、 
对 象 的 引用 或 数据 可 以 在 线程 之 间 传 递 。 虽然 通常 可 以 在 进程 之 间 共 享 内 存 ,但 这 难以 
建立 并 且 通 常 难以 管理 ， iiaeaae 图 14 
显示 了 一 个 进程 中 的 两 个 线程 通过 共享 内 存 进行 通信 。 
共享 的 地 址 空间 ， 以 及 缺少 线程 间 的 数据 保护 ， 使 
得 使 用 多 线程 相关 的 开销 远 小 于 使 用 多 进程 ， 因 为 操作 
系统 有 更 少 的 敌 记 要 做 。 但 是 ， 共 享 内 存 的 灵活 性 是 有 
代价 的 ， 如 果 数 据 要 被 多 个 线程 访问 ， 那 么 程序 员 必 须 
确保 当 每 个 线程 访问 时 所 看 到 的 数据 是 一 致 的 。 线 程 间 
数据 共享 可 能 会 遇 到 的 问题 、 所 使 用 的 工具 以 及 为 了 避 


3、4、5 和 8 章 中 。 这 些 问 题 并 非 不 能 克服 ， 只 要 在 纺 
写 代码 时 适当 地 注意 即 可 ， 但 这 却 意味 着 必须 对 线程 之 
间 的 通信 和 作 大 量 的 思考 。 

相 比 于 启动 多 个 单线 程 进 程 并 在 其 间 进 行 通信 ， 启动 单一 进程 中 的 多 线程 并 在 其 间 
进行 通信 的 开销 更 低 ， 这 意味 着 若 不 考虑 共享 内 存 可 能 会 带 来 的 潜在 问题 ， 它 是 包括 
c++ 在 内 的 主流 语言 更 青睐 的 并 发 途径 。 此 外 ，C++ 标 准 没有 为 进程 间 通 信 提 供 任何 原 
生 支持 ， 所 以 使 用 多 进程 的 应 用 程序 将 不 得 不 依赖 平台 相关 的 API 来 实现 。 因 此 ， 本 书 
专门 关注 使 用 多 线程 的 并 发 ， 并 且 之 后 提 到 并 发 均 是 假定 通过 使 用 多 线程 来 实现 的 。 

明确 了 什么 是 并 发 后 ， 现 在 让 我 们 来 看 看 为 什么 要 在 应 用 程序 中 使 用 并 发 。 


为 什么 使 用 并 发 


在 应 用 程序 中 使 用 并 发 的 原因 主要 有 两 个 ， 关 注 点 分 离 和 性 能 。 事 实 上 ， 我 甚至 
可 以 说 它们 差不多 是 使 用 并 发 的 唯一 原因 ， 当 你 观察 得 足够 仔细 时 ， 一 切 其 他 因素 都 
可 以 归结 到 这 两 者 之 一 (或 者 可 能 是 二 者 兼 有 ， 当 然 ， 除 了 像 “我 愿意 ”这 样 的 原因 
co). 


图 1.4 ”同一 进程 中 的 一 对 并 发 
运行 的 线程 之 间 的 通信 


为 了 划分 关注 点 而 使 用 并 发 


在 编写 软件 时 ， 划 分 关注 点 总 是 个 好 主意 。 通 过 将 相关 的 代码 放 在 一 起 并 将 无 关 的 
代码 分 开 ， 这 种 方法 可 以 使 你 的 程序 更 容易 理解 和 测试 ， 从 而 减少 出 错 的 可 能 性 。 你 可 
以 使 用 并 发 来 分 隔 不 同 的 功能 区 域 ， 即 使 在 这 些 不 同 功能 区 域 的 操作 需要 在 同一 时 刻 改 
生 的 情况 下 。 如 果 不 显 式 地 使 用 并 发 ， 你 要 么 被 迫 编写 任务 切换 框架 ， 要 么 在 操作 中 主 
动 地 调用 不 相关 的 一 段 代 码 。 
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考虑 一 类 带 有 用 户 界面 的 密集 处 理 型 应 用 程序 ， 例 如 为 台式 计算 机 提供 的 DVD 播 
放 程序 。 这 样 一 个 应 用 程序 基本 上 具备 两 套 职能 : 它 不 仅 要 从 光盘 中 读 取 数 据 ， 解 码 图 
像 和 声音 ， 并 把 它们 及 时 输出 至 视频 和 音频 硬件 ， 从 而 实现 DVD 的 无 错 播放 ， 它 还 要 
接受 来 自用 户 的 输入 ， 例 如 当 用 户 单 击 暂停 或 返回 菜单 甚至 退出 按键 的 情况 。 在 单个 线 
程 中 ， 应 用 程序 须 在 回放 期 间 定期 检查 用 户 的 输入 ， 于 是 将 DVD 回放 代码 和 用 户 界面 
代码 合 在 一 起 。 通 过 使 用 多 线程 来 分 隔 这 些 关 注 点 ， 用 户 界 面 代码 和 DVD 回放 代码 不 
再 需要 如 此 紧密 地 交织 在 一 起 。 一 个 线程 可 以 处 理 用 户 界面 ， 另 一 个 处 理 DVD 回放 ， 
它们 之 间 会 有 交互 ， 例 如 用 户 点 击 暂 停 ， 但 现在 这 些 交 互 直接 与 眼前 的 任务 有 关 。 

这 会 带 来 响应 性 的 错觉 ， 因 为 用 户 界面 线程 通常 可 以 立即 响应 用 户 的 请 求 ， 即 使 在 
请 求 被 传达 给 工作 的 线程 ， 响 应 为 简单 地 显示 正 忙 的 光标 或 请 等 待 的 消息 的 情况 。 类 似 
地 ， 独立 的 线程 常 被 用 于 运行 必须 在 后 台 连 续 运 行 的 任务 , 例如 在 桌面 搜索 程序 中 监视 
文件 系统 的 变化 。 以 这 种 方式 使 用 线程 一 般 会 使 每 个 线程 的 逻辑 更 加 简单 ， 因 为 它们 之 
间 的 交互 可 以 被 限制 为 清晰 可 辨 的 点 ， 而 不 是 到 处 散播 不 同 任务 的 逻辑 。 

在 这 种 情况 下 ， 线 程 的 数量 与 CPU 可 用 内 核 的 数量 无 关 ， 因 为 对 线程 的 划分 是 基 
于 概念 上 的 设计 而 不 是 试图 增加 吞吐 量 。 


1.2.2 为 了 性 能 而 使 用 并 发 


多 处 理 器 系统 已 经 存在 了 几 十 年 ， 但 直到 最 近 ， 他 们 几乎 只 能 在 超级 计算 机 、 大 型 
机 和 大 型 服务 器 系统 中 才能 看 到 。 然 而 芯片 制造 商 越 来 越 倾向 于 多 核 世 片 的 设计 ， 即 在 
单个 芯片 上 集成 2、4、16 或 更 多 的 处 理 器 ， 从 而 达到 比 单 核心 更 好 的 性 能 。 因 此 ， 多 
核 台 式 计算 机 ， 甚 至 多 核 租 入 式 设备 ， 现 在 越 来 越 普遍 。 这 些 计算 机 的 计算 能 力 的 提高 
不 是 源 自 使 单一 任务 运行 的 更 快 ， 而 是 源 自 并 行 运行 多 个 任务 。 在 过 去 , 程序 员 曾 坐等 
他 们 的 程序 随 着 处 理 器 的 更 新 换代 而 变 得 更 快 , 无 需 他 们 这 边 做 出 任何 努力 。 但 是 现在 ， 
PLR Herb Sutter 所 说 的 ,，“ 免 费 的 午餐 结束 了 !”。 如 果 软件 想 要 利用 日 益 增长 的 计算 能 
力 ， 它 必须 设计 为 并 发 运行 多 个 任务 。 程 序 员 因此 必须 留意 ， 而 且 那 些 迄 今 都 忽略 并 发 
的 人 们 必须 注意 它 并 将 其 加 入 他 们 的 工具 箱 中 。 

有 两 种 方式 为 了 性 能 使 用 并 发 。 首 先 ， 也 是 最 明显 的 ， 是 将 一 个 单个 任务 分 成 几 部 
分 且 各 自 并 行 运行 ， 从 而 降低 总 运行 时 间 ， 这 就 是 任务 并 行 (task parallelism )。 虽 然 这 
听 起 来 很 直观 ， 但 它 可 以 是 一 个 相当 复杂 的 过 程 ， 因 为 在 各 个 部 分 之 间 可 能 存在 很 多 的 
依赖 。 区 别 可 能 是 在 过 程 方面 一 一 一 个 线程 执行 算法 的 一 部 分 而 另 一 个 线程 执行 算法 的 
为 一 部 分 一 一 或 是 在 数据 方面 一 每 个 线程 在 不 同 的 数据 部 分 上 执行 相同 的 操作 。 后 一 
种 方法 被 称 为 数据 并 行 (data parallelism), 


! The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software, Herb Sutter, Dr. Dobb's 
Journal, 30(3), March 2005. http://www. gotw.ca/publications/concurrency-ddj.htm 
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容易 受 这 种 并 行 影响 的 算法 常 被 称 为 易 并 行 (embarrassingly parallel), 抛 开 你 可 
能 会 赣 众 地 面 对 的 很 容易 并 行 化 的 代码 这 一 含义 ,这 是 一 件 好 事情 。 我 曾 遇 到 过 的 头 于 
此 算法 的 别 的 术语 是 自然 并 行 naturally parallel ) 和 便利 并 发 《conveniently 
concurrent)。 易 并 行 算法 具有 良好 的 可 扩展 特性 一 一 随 着 可 用 硬件 线程 数量 的 提升 , 算 
法 的 并 行 性 可 以 随 之 增加 与 之 匹配 。 这 样 的 一 个 算法 是 谚语 “人 多 力量 大 ”的 完美 体现 。 
对 于 非 易 并 行 算法 的 那 一 部 分 ， 你 可 以 将 算法 划分 为 一 个 固定 〈 因 而 不 可 扩展 ) 数量 的 
并 行 任务 。 在 线程 之 间 划 分 任务 的 技巧 涵盖 在 第 8 章 中 。 

使 用 并 发 来 提升 性 能 的 第 二 种 方法 是 使 用 可 用 的 并 行 方式 来 解决 更 大 的 问题 。 与 其 

同时 处 理 一 个 文件 ， 不 如 酌情 处 理 2 个 或 10 个 或 20 个 。 虽然 这 实际 上 只 是 数据 并 行 的 
一 种 应 用 ， 通 过 对 多 组 数据 同时 执行 相同 的 操作 ， 但 还 是 有 不 同 的 重点 。 处 理 一 个 数据 
块 仍然 需要 同样 的 时 间 ， 但 在 相同 的 时 间 内 却 可 以 处 理 更 多 的 数据 。 当 然 ， 这 种 方法 也 
存在 限制 ， 且 并 非 在 所 有 情况 下 都 是 有 益 的 ， 但 是 这 种 方法 所 带 来 的 春 吐 量 提升 可 以 让 
一 些 新 玩意 变 得 可 能 。 例 如 ， 如 果 图 片 的 各 部 分 可 以 并 行 处 理 ， 就 能 提高 视频 处 理 的 分 
PER, 


什么 时 候 不 使 用 并 发 


知道 何 时 不 使 用 并 发 与 知道 何 时 要 使 用 它 同等 重要 。 基 本 上 ,不 使 用 并 发 的 唯一 原 
因 就 是 在 收益 比 不 上 成 本 的 时 候 。 使 用 并 发 的 代码 在 很 多 情况 下 难以 理解 ， 因 此 编写 和 
维护 的 多 线程 代码 就 有 直接 的 脑力 成 本 ， 同 时 额外 的 复杂 性 也 可 能 导致 更 多 的 错误 。 除 
非 潜在 的 性 能 增益 足够 大 或 关注 点 分 离 得 足够 清晰 ， 能 抵消 确保 其 正确 所 需 的 额外 的 开 
发 时 间 以 及 与 维护 多 线程 代码 相关 的 额外 成 本 ， 否 则 不 要 使 用 并 发 。 

同样 地 ， 性 能 增益 可 能 不 会 如 预期 的 那么 大 。 在 启动 线程 时 存在 固有 的 开销 ， 因 为 
操作 系统 必须 分 配 相关 的 内 核资 源 和 堆栈 空间 ， 然 后 将 新 线程 加 入 调度 器 中 ， 所 有 这 一 
切 都 要 占用 时 间 。 如 果 在 线程 上 运行 的 任务 完成 得 很 快 ,那么 任务 实际 上 占据 的 时 间 己 
启动 线程 的 开销 时 间 相 比 就 显得 微不足道 , 可 能 会 导致 应 用 程序 的 整体 性 能 还 不 如 通过 
产生 线程 直接 执行 该 任务 。 

此 外 ， 线 程 是 有 限 的 资源 。 如 果 让 太 多 的 线程 同时 运行 ， 则 会 消耗 操作 系统 资源 ， 
并 且 使 得 操作 系统 整体 上 运行 得 更 缓慢 。 不 仅 如 此 ， 运 行 太 多 的 线程 会 耗 尽 进程 的 可 用 
内 存 或 地 址 空间 ， 因 为 每 个 线程 都 需要 一 个 独立 的 堆栈 空间 。 对 于 一 个 可 用 地 址 空间 限 
制 为 4GB 的 扁平 架构 的 32 位 进程 来 说 , 这 尤其 是 个 问题 。 如 果 每 个 线程 都 有 一 个 1MB 
的 堆栈 (对 于 很 多 系统 来 说 是 典型 的 ) ， 那 么 4096 个 线程 将 会 用 尽 所 有 地 址 空间 ， 不 再 
为 代码 、 静 态 数据 或 者 堆 数 据 留 有 空间 。 虽 然 64 位 (或 者 更 大 ) 的 系统 不 存在 这 种 直 
接 的 地 址 空间 限制 ， 它 们 仍然 只 具备 有 限 的 资源 ; 如 果 你 运行 太 多 的 线程 ， 最 终 会 导致 
问题 。 尽 管线 程 池 (参见 第 9 章 ) 可 以 用 来 限制 线程 的 数量 ， 但 这 并 不 是 灵丹妙药 ， 它 
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们 也 有 自己 的 问题 。 

如 果 客 户 端 /服务 器 应 用 程序 的 服务 器 端 为 每 一 个 链接 启动 一 个 独立 的 线程 , 对 于 少 
量 的 链接 是 可 以 正常 工作 的 ， 但 当 同 样 的 技术 用 于 需要 处 理 大 量 链接 的 高 需求 服务 器 
时 ， 就 会 因为 启动 太 多 线程 而 迅速 耗 尽 系统 资源 。 在 这 种 场景 下 ， 遵 慎 地 使 用 线程 池 可 
以 提供 优化 的 性 能 (参见 第 9 章 )。 

最 后 ， 运 行 越 多 的 线程 ， 操 作 系统 就 需要 做 越 多 的 上 下 文 切换 。 每 个 上 下 文 切换 都 
需要 耗费 本 可 以 花 在 有 价值 工作 上 的 时 间 ， 所 以 在 某 些 时 候 ， 增 加 一 个 额外 的 线程 实际 
上 会 降低 而 不 是 提高 应 用 程序 的 整体 性 能 。 为 此 ， 如 果 你 试图 得 到 系统 的 最 佳 性 能 ， 考 
虑 可 用 的 硬件 并 发 (RREZ) 并 调整 运行 线程 的 数量 是 必需 的 。 

为 了 性 能 优化 而 使 用 并 发 就 像 所 有 其 他 优化 策略 一 样 ， 它 拥有 极 大 提高 应 用 程序 性 
能 的 潜力 ， 但 它 也 可 能 使 代码 复杂 化 ， 使 其 更 难 理解 和 更 容易 出 错 。 因 此 ， 只 有 对 应 用 
程序 中 的 那些 具有 显著 增益 潜力 的 性 能 关键 部 分 才 值得 这 样 做 。 当 然 ， 如 果 性 能 收益 的 
潜力 仅 次 于 设计 清晰 或 关注 点 分 离 ， 可 能 也 值得 使 用 多 线程 设计 。 

假设 你 已 经 决定 确实 要 在 应 用 程序 中 使 用 并 发 ， 无 论 是 为 了 性 能 、 关 注 点 分 离 ， 或 
是 因为 “多 线程 星期 一 "， 对 于 C++ 程序 员 来 说 意味 着 什么 ? 


在 G++ 中 使 用 并 发 和 多 线程 


通过 多 线程 为 并 发 提供 标准 化 的 支持 对 C++ 来 说 是 新 鲜 事 物 。 只 有 在 即将 到 来 的 
C++11 标准 中 ， 你 才能 不 依赖 平台 相关 的 扩展 来 编写 多 线程 代码 。 为 了 理解 新 版 本 C++ 
线程 库 中 众多 规则 背后 的 基本 原理 ， 了 解 其 历史 是 很 重要 的 。 


C++ 多 线程 历程 


1998C++ 标 准 版 不 承认 线程 的 存在 ， 并 且 各 种 语言 要 素 的 操作 效果 都 以 顺序 抽象 机 
的 形式 编写 。 不 仅 如 此 ， 内 存 模 型 也 没有 被 正式 定义 ， 所 以 对 于 1998 C++ 标准 ， 你 没 办 
法 在 缺少 编译 器 相关 扩展 的 情况 下 编写 多 线程 应 用 程序 。 

当然 ， 编 译 器 供应 商 可 以 自由 地 向 语言 添加 扩展 ， 并 且 针 对 多 线程 的 C API 的 
流行 一 一 例如 在 POSIX C 和 Microsoft Windows API 中 的 那些 一 一 导致 很 多 C++ 编译 
器 供应 商 通 过 各 种 平台 相关 的 扩展 来 支持 多 线程 。 这 种 编译 器 支持 普遍 地 受 限于 只 
允许 使 用 该 平台 相应 的 CAPI 以 及 确保 该 C++ 运行 时 库 (例如 异常 处 理 机 制 的 代码 ) 
在 多 线程 存在 的 情况 下 运行 。 尽 管 极 少 有 编译 器 供应 商 提供 了 一 个 正式 的 多 线程 感 
知 内 存 模型 ， 但 编译 器 和 处 理 器 的 实际 表现 也 已 经 足够 好 ， 以 至 于 大 量 的 多 线程 的 
C++ 程序 已 被 编写 出 来 。 

由 于 不 满足 于 使 用 平台 相关 的 C API 来 处 理 多 线程 ，C++ 程 序 员 曾 期 望 他 们 的 类 库 
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提供 面向 对 象 的 多 线程 工具 。 像 MFC 这 样 的 应 用 程序 框架 ， 以 及 像 Boost 和 ACE 这 样 
的 CH+ 通 用 类 库 曾 积累 了 多 套 CHK, 封装 了 下 层 的 平台 相关 API 并 提供 高 级 的 多 线程 
工具 以 简化 任务 。 各 类 库 的 具体 细节 ， 特 别 是 在 启动 新 线程 的 方面 ， 存 在 很 大 差异 ,但 
是 这 些 类 的 总 体 构造 存在 很 多 共通 之 处 。 有 一 个 为 许多 C++ 类 库 共 有 的 ， 同 时 也 是 为 
程序 员 提供 很 大 便利 的 特别 重要 的 设计 ， 就 是 带 锁 的 资源 获得 即 初始 化 “RAIL 
Resource Acquisition Is Initialization ) 的 习惯 用 法 ， 来 确保 当 退 出 相 关 作用 域 的 时 候 
互 斥 元 被 解锁 。 

许多 情况 下 ， 现 有 的 C++ 编译 器 所 提供 的 多 线程 支持 ， 例 如 Boost HACE, 综合 了 
平台 相关 API 以 及 平台 无 关 类 库 的 可 用 性 ,为 编写 多 线程 Ct+ 代 码 提供 一 个 坚实 的 基础 ， 
也 因此 大 约 有 数 百 万 行 C++ 代码 作为 多 线程 应 用 程序 的 一 部 分 而 被 编写 出 来 。 但 缺乏 标 
准 的 支持 ,意味 着 存在 缺少 线程 感知 内 存 模型 从 而 导致 问题 的 场合 ,特别 是 对 于 那些 试 
图 通过 使 用 处 理 器 硬件 能 力 来 获取 更 高 性 能 ,或 是 编写 跨 平台 代码 ,但 是 在 不 同 平台 之 
间 编 译 器 的 实际 表现 存在 差异 。 


1.3.2 ”新 标准 中 的 并 发 支持 


所 有 这 些 都 随 着 新 的 C++11 标准 的 发 布 而 改变 了 。 不 仅 有 了 一 个 全 新 的 线程 感 
知 内 存 模型 ，C++ 标 准 库 也 被 扩展 了 ， 包 含 了 用 于 管理 线程 (参见 第 2 章 ) 、 保 护 共 
SH (参见 第 3 章 )、 线 程 间 同步 操作 (参见 第 4 章 ) 以 及 低级 原子 操作 (参见 第 
5 章 ) 的 名 个 类 。 

新 的 C++ 线程 库 很 大 程度 上 基于 之 前 通过 使 用 上 文 提 到 的 C++ 类 库 而 积累 的 经 验 。 
特别 地 ，Boost 线程 库 被 用 作 新 类 库 所 基于 的 主要 模型 ， 很 多 类 与 Boost 中 的 对 应 者 共 
享 命名 和 结构 。 在 新 标准 演进 的 过 程 中 ， 这 是 个 双向 流动 ，Boost 线程 库 也 改变 了 自己 ， 
以 便 在 多 个 方面 匹配 C++ 标准 ， 因 此 从 Boost 迁移 过 来 的 用 户 将 会 发 现 自己 非常 适应 。 

正如 本 章 开篇 提 到 的 那样 ， 对 并 发 的 支持 仅仅 是 新 C++ 标准 的 变化 之 一 ， 此 外 还 存 
在 很 多 对 于 编程 语言 自身 的 改善 ， 可 以 使 得 程序 员 们 的 工作 更 便捷 。 这 些 内 容 虽 然 不 在 
本 书 的 论述 范围 之 内 , 但 是 其 中 的 一 些 变化 对 于 线程 库 本 身 及 其 使 用 方式 已 经 形成 了 直 
接 的 冲击 。 附 录 A 对 这 些 语言 特性 做 了 简要 的 介绍 。 

C++ 中 对 原子 操作 的 直接 支持 ， 人 允许 程 序 员 编写 具有 确定 语义 的 高 效 代码 ， 而 无 需 
平台 相关 的 汇编 语言 。 这 对 于 那些 试图 编写 高 效 的 、 可 移植 代码 的 程序 员 们 来 说 是 一 个 
真正 的 福利 。 不 仅 有 编译 器 可 以 搞定 平台 的 具体 内 容 ， 还 可 以 编写 优化 器 来 考虑 操作 的 
语义 ， 从 而 让 程序 作为 一 个 整体 得 到 更 好 的 优化 。 


1.3.3 C++ 线程 库 的 效率 


对 于 CH 整体 以 及 包含 低级 工具 的 C++ 类 一 一 特别 是 在 新 版 C++ 线程 库 里 的 那些 ， 
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参与 高 性 能 计算 的 开发 者 常常 关注 的 一 点 就 是 效率 。 如 果 你 正 寻 求 极 致 的 性 能 ， 那 么 理 
解 与 直接 使 用 底层 的 低级 工具 相 比 ， 使 用 高 级 工具 所 带 来 的 实现 成 本 ， 是 很 重要 的 。 这 
个 成 本 就 是 抽象 惩罚 (abstraction penalty), 

C++ 标准 委员 会 在 整体 设计 C++ 标准 库 以 及 专门 设计 标准 C++ 线程 库 的 时 候 ， 就 已 
经 十 分 注重 这 一 点 了 。 其 设计 的 目标 之 一 就 是 在 提供 相同 的 工具 时 ， 通 过 直接 使 用 低级 
API 就 几乎 或 完全 得 不 到 任何 好 处 。 因 此 该 类 库 被 设计 为 在 大 部 分 平台 上 都 能 高 效 实现 
( 带 有 非常 低 的 抽象 惩罚 ) 。 

C++ 标准 委员 会 的 另 一 个 目标 ， 是 确保 C++ 能 提供 足够 的 低级 工具 给 那些 希望 与 硬 
件 工作 得 更 紧密 的 程序 员 , 以 获取 终极 性 能 。 为 了 达到 这 个 目的 , 伴随 着 新 的 内 存 模型 ， 
出 现 了 一 个 全 面 的 原子 操作 库 ， 用 于 直接 控制 单个 位 、 字 节 、 线 程 间 同步 以 及 所 有 变化 
的 可 见 性 。 这 些 原子 类 型 和 相应 的 操作 现在 可 以 在 很 多 地 方 加 以 使 用 ， 而 这 些 地 方 以 前 
通常 被 开发 者 选择 下 放 到 平台 相关 的 汇编 语言 中 。 使 用 了 新 的 标准 类 型 和 操作 的 代码 因 
而 具有 更 佳 的 可 移植 性 ， 并 且 更 易于 维护 。 

C++ 标准 库 也 提供 了 更 高 级 别 的 抽象 和 工具 ， 它 们 使 得 编写 多 线程 代码 更 简单 和 不 
易 出 错 。 有 时 候 运 用 这 些 工具 确实 会 带 来 性 能 成 本 ， 因 为 必须 执行 额外 的 代码 。 但 是 这 
种 性 能 成 本 并 不 一 定 意味 着 更 高 的 抽象 惩罚 ， 总体 来 看 ， 这 种 性 能 成 本 并 不 比 通过 手工 
编写 等 效 的 函数 而 招致 的 成 本 更 高 ， 同 时 编译 器 可 能 会 很 好 地 内 联 大 部 分 额外 的 代码 。 

在 某 些 情况 下 ， 高 级 工具 提供 超出 特定 使 用 需求 的 额外 功能 。 在 大 部 分 情况 下 这 都 
不 是 问题 ， 你 没有 为 你 不 使 用 的 那 部 分 买单 。 在 罕见 的 情况 下 ， 这 些 未 使 用 的 功能 会 影 
响 其 他 代码 的 性 能 。 如 果 你 更 看 重 程序 的 性 能 ， 且 代价 过 高 ， 你 可 能 最 好 是 通过 较 低级 
别 的 工具 来 手工 实现 需要 的 功能 。 在 绝 大 多 数 情 况 下 ， 额 外 增加 的 复杂 性 和 出 错 的 几率 
远大 于 小 小 的 性 能 提升 所 带 来 的 潜在 收益 。 即 使 有 证 据 确 实 表明 瓶颈 出 现在 C++ 标准 库 
的 工具 中 ， 这 也 可 能 归咎 于 低劣 的 应 用 程序 设计 而 非 低劣 的 类 库 实 现 。 例 如 ， 如 果 过 多 
的 线程 竞争 一 个 互 斥 元 ， 这 将 会 显著 影响 性 能 。 与 其 试图 在 互 斥 操作 上 花 掉 一 点 点 的 时 
间 ， 还 不 如 重新 构造 应 用 程序 以 减少 互 斥 元 上 的 竞争 来 得 划算 。 设 计 应 用 程序 以 减少 竞 
争 会 在 第 8 章 中 加 以 阐述 。 

在 非常 罕见 的 情况 下 ，C++ 标 准 库 不 提供 所 需 的 性 能 或 行为 ， 这 时 则 有 必要 运用 特 
定 的 平台 相关 的 工具 。 


1.3.4 平台 相关 的 工具 


虽然 C++ 线程 库 为 多 线程 和 并 发 处 理 提供 了 颇 为 全 面 的 工具 ， 但 是 在 所 有 的 平台 
上 ， 都 会 有 些 额外 的 平台 相关 工具 。 为 了 能 方便 地 访问 那些 工具 而 又 不 用 放弃 使 用 标准 
C++ 线程 库 带 来 的 好 处 ，C++ 线 程 库 中 的 类 型 可 以 提供 一 个 native handle () MAM 
数 ， 多 许 通过 使 用 平台 相关 API 直接 操作 底层 实现 。 就 其 本 质 而 言 ， 任 何 使 用 
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native handle () 执行 的 操作 是 完全 依赖 于 平台 的 ， 这 也 超出 了 本 书 (同时 也 是 标准 
C++ 库 本 身 ) 的 范围 。 

当然 ， 在 考虑 使 用 平台 相关 的 工具 之 前 ， 明白 标准 库 能 够 提供 什么 是 很 重要 的 ， 那 
么 让 我 们 通过 一 个 例子 来 开始 。 


开始 入 门 


好 , 现在 你 有 一 个 很 棒 的 与 C++11 兼容 的 编译 器 。 接 下 来 呢 ? 一 个 多 线程 C++ 程序 
是 什么 样子 的 ? 它 看 上 去 和 其 他 所 有 C++ 程序 一 样 ， 通 常 是 变量 、 类 以 及 函数 的 组 合 。 
唯一 真正 的 区 别 在 于 某 些 函数 可 以 并 发 运行 ， 所 以 你 需要 确保 共享 数据 的 并 发 访问 是 安 
全 的 ， 详 见 第 3 章 。 当 然 , 为 了 并 发 地 运行 函数 ， 必须 使 用 特定 的 函数 以 及 对 象 来 管理 
各 个 线程 。 


你 好 ， 并 发 世界 


让 我 们 从 一 个 经 典 的 例子 开始 : 一 个 打印 “Hello World.” 的 程序 。 一 个 非常 简单 的 
在 单线 程 中 运行 的 Hello, World 程序 如 下 所 示 ， 当 我 们 谈 到 多 线程 时 ， 它 可 以 作为 一 个 
基准 。 
#include <iostream> 


int main() 


{ 
} 


std: :cout<<"Hello World\n"; 


清单 1.1 这 个 程序 所 做 的 一 切 就 是 将 “Hello World” 写 进 标准 输出 流 。 让 我 们 将 它 
与 下 面 清单 所 示 的 简单 的 Hello, Concurrent World 程序 做 个 比较 ， 它 启动 了 一 个 独立 的 
线程 来 显示 这 个 信息 。 


清单 1.1 一 个 简单 的 Hello,Concurrent World 程序 
#include <iostream> 
#include <thread> 0 
void hello () -© 


{ 
} 


int main() 


{ 


std: :cout<<"Hello Concurrent World\n"; 


std::thread t(hello); <@ 
t.join(); 0 
) 
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第 一 个 区 别 是 增加 了 #include<thread>@。 在 标准 C++ 库 中 对 多 线程 支持 的 声 
明 在 新 的 头 文件 中 ， 用 于 管理 线程 的 函数 和 类 在 <thread> 中 声明 ， 而 那些 保护 共享 数 
据 的 函数 和 类 在 其 他 头 文件 中 声明 。 

其 次 , 写 信息 的 代码 被 移动 到 了 一 个 独立 的 函数 中 @。 这 是 因为 每 个 线程 都 必须 具 
有 一 个 初始 函数 Cinitial function)， 新 线程 的 执行 在 这 里 开始 。 对 于 应 用 程序 来 说 ， 初 
始 线程 是 main () ， 但 是 对 于 所 有 其 他 线程 ， 这 在 std: : thread 对 象 的 构造 函数 中 指 
定 一 一 在 本 例 中 ， 被 命名 为 t@ H std: :thread 对 象 拥有 新 函数 hello () 作为 其 初 
始 函数 。 

下 一 个 区 别 , 与 直接 写 和 标准 输出 或 是 从 main () 调用 hello ORE, 该 程序 启动 
了 一 个 全 新 的 线程 来 实现 ， 将 线程 数量 一 分 为 二 一 一 初 始 线程 始 于 main () 而 新 线程 始 
Fhello(), 

在 新 的 线程 启动 之 后 目 ， 初 始 线程 继续 执行 。 如 果 它 不 等 待 新 线程 结束 ， 它 就 将 自 
顾 自 地 继续 运行 到 main () 的 结束 ， 从 而 结束 程序 一 一 有 可 能 发 生 在 新 线程 有 机 会 运行 
之 前 。 这 就 是 为 什么 在 © 这 里 调用 join O 的 原因 一 一 详 见 第 2 章 ， 这 会 导致 调用 线 
程 (在 main () 中 ) 等 待 与 std: : thread 对 象 相关 联 的 线程 ， 即 这 个 例子 中 的 七 。 

如 果 这 看 起 来 像 是 仅仅 为 了 将 一 条 信息 写 人 标准 输出 而 做 了 大 量 的 工作 , 那么 它 确 
实 如 此 一 一 正如 上 文 1.2.3 节 所 描述 的 ， 一 般 来 说 并 不 值得 为 了 如 此 简单 的 任务 而 使 用 
多 线程 ， 尤 其 是 如 果 在 这 期 间 初 始 线程 无 所 事 事 。 在 本 书后 面 的 内 容 中 ,我 们 将 通过 实 
例 来 展示 在 哪些 情景 下 使 用 多 线程 可 以 获得 明确 的 收益 。 


小 结 


在 本 章 中 , 我 提 及 了 并 发 与 多 线程 的 含义 以 及 在 你 的 应 用 程序 中 为 什么 会 选择 使 用 
(或 不 使 用 ) E. 我 还 提 及 了 多 线程 在 C++ 中 的 发 展 历程 , 从 1998 标准 中 完全 缺乏 支持 ， 
经 历 了 各 种 平台 相关 的 扩展 , 再 到 新 的 C++11 标准 中 具有 合适 的 多 线程 支持 。 该 支持 到 
来 的 正 是 时 候 , 它 使 得 程序 员 们 可 以 利用 伴随 新 的 CPU 而 带 来 的 更 加 强大 的 硬件 并 发 ， 
因为 芯片 制造 商 选择 了 以 多 核心 的 形式 使 得 更 多 任务 可 以 同时 执行 的 方式 来 增加 处 理 
能 力 ， 而 不 是 增加 单个 核心 的 执行 速度 。 

在 LA 节 中 的 示例 中 展示 了 C++ 标准 库 中 的 类 和 函数 有 多 人 么 的 简单 。 在 Corp, dii 
用 多 线程 本 身 并 不 复杂 ， 复 杂 的 是 如 何 设计 代码 以 实现 其 预期 的 行为 。 

在 尝试 了 1.4 节 的 示例 之 后 ， 是 时 候 看 看 更 多 实质 性 的 内 容 了 。 在 第 2 章 中 ， 我 们 
将 看 一 看 用 于 管理 线程 的 类 和 函数 。 


那么 ， 你 已 经 下 决心 为 你 的 应 用 程序 使 用 并 发 了 。 特 别 地 ， 你 决定 了 使 用 多 线程 。 
BFR? 如何 启 动 这 些 线程 ， 怎 样 检查 它们 已 完成 ， 怎 样 监视 它们 呢 ? C++ 标准 库 让 
大 多 数 线程 管理 任务 变 得 相对 简单 , 通过 与 给 定 线程 相关 联 的 std: :thread 对 象 就 可 
以 管理 所 有 事情 ， 如 你 将 要 看 到 的 那样 。 对 于 那些 并 不 直观 的 任务 ， 标 准 库 也 提供 了 从 
基本 构建 块 进行 按 需 构建 的 可 扩展 性 。 

在 本 章 中 , 我 将 从 基础 开始 阐述 。 启 动 一 个 线程 , 等待 它 完成 ,或 是 在 后 台 运 行 它 。 
接 下 来 我 们 将 看 一 看 在 线程 函数 启动 时 向 其 传递 额外 的 参数 ， 以 及 如 何 将 线程 的 所 有 权 
从 一 个 std: :thread 对 象 转移 到 另 一 个 最 后 , 我 们 会 看 一 看 选择 所 使 用 的 线程 数量 ， 
以 及 标识 特定 的 线程 。 


21 基本 线程 管理 
每 个 C++ 程序 都 拥有 至 少 一 个 线程 ， 它 是 由 C++ 在 运行 时 启动 的 ， 该 线程 运行 着 
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main () 函数 。 你 的 程序 可 以 继续 启动 具有 其 他 函数 作为 人 口 的 线程 。 然 后 ， 这 些 线程 
连同 初始 线程 一 起 ， 并 发 运行 。 正 如 程序 会 在 main () 函数 返回 时 退出 那样 ， 当 指定 的 
人 口 函数 返回 时 ， 该 线程 就 会 退出 。 如 你 所 见 ， 如 果 你 有 线程 对 应 的 std: :thread 对 
象 ， 你 就 可 以 等 待 它 完成 。 但 首先 你 得 启动 它 ， 所 以 让 我 们 来 看 一 看 启动 线程 。 


启动 线程 


如 同 你 在 第 1 章 中 所 看 到 的 , 线程 是 通过 构造 std: : thread 对 象 来 开始 的 ， 该 对 
象 指定 了 线程 上 要 运行 的 任务 。 在 最 简单 的 情况 下 ,该 任务 仅仅 是 一 个 普 普 通通 的 返回 
void 且 不 接受 参数 的 函数 。 这 个 函数 在 自己 的 线程 上 运行 ， 直到 返回 ,然后 线程 停止 。 
但 从 另 一 个 极端 看 ， 该 任务 可 能 是 一 个 接受 额外 参数 的 函数 对 象 ， 当 它 运行 时 ， 会 执行 
一 系列 由 某 种 消息 机 制 所 指定 的 相互 独立 的 操作 , 并 且 只 有 当 线程 再 次 通过 某 种 消息 机 
制 接收 到 信号 时 才 会 停止 。 无 论 线程 将 要 做 什么 或 是 从 哪里 启动 ， 使 用 C++ 线程 库 来 开 
始 一 个 线程 总 归 是 要 构造 一 个 std: :thread HA, 


void do some work(); 
std::thread my thread(do some work); 


就 是 这 么 简单 。 当 然 ， 你 必须 确保 引入 了 <thread> 头 文件 ， 从 而 编译 器 可 以 找到 
std::thread 类 的 定义 。 与 许多 C++ 标准 库 相 似 ，std: :thread 可 以 与 任何 可 调用 
Ceallable) 类 型 一 同 工 作 ， 所 以 你 可 以 将 一 个 带 有 函数 调用 操作 符 的 类 的 实例 传递 给 
std: : thread 的 构造 函数 来 进行 代替 。 


class background task 


{ 
public: 
void operator()() const 


do something.(); 
do something else(); 


) 
hi 
background task f; 
std::thread my thread(f); 


在 这 种 情况 下 ， 所 提供 的 函数 对 象 被 复制 (copied〉 到 属于 新 创建 的 执行 线程 的 存 
储 器 中 ， 并 从 那里 调用 。 因 此 重要 的 是 ， 副 本 与 原版 有 着 等 效 的 行为 ， 否 则 结果 可 能 会 
与 预期 不 符 。 

当 给 线程 构造 函数 传递 一 个 函数 对 象 时 要 考虑 的 一 件 事 是 避免 所 谓 的 “C+ 的 最 环 
手 的 解析 ”。 如 果 你 传递 一 个 临时 的 且 未 命名 的 变量 ,那么 其 语法 可 能 与 函数 声明 一 样 ， 
在 这 种 情况 下， 编译 器 会 将 其 解释 成 如 下 这 样 ， 而 非 对 象 定义 。 例 如 ， 


std::thread my thread(background task()); 
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声明 了 函数 my_thread， 它 接受 单个 参数 (参数 类 型 是 指向 不 接受 参数 同时 返回 
background task 对 象 的 函数 的 指针 )， 并 返回 std: : thread 对 象 ， 而 不 是 启动 一 
个 新 线程 。 你 可 以 像 前 面 说 的 那样 通过 命名 函数 对 象 来 避免 这 种 情况 ， 通 过 使 用 一 组 额 
外 的 括号 ， 或 使 用 新 的 统一 初始 化 语法 ， 例 如 ， 


std::thread my thread((background task())) ; 0 
std::thread my thread(background task]; < 四 


在 第 一 个 例子 @8 中 ， 额 外 的 括号 避免 其 解释 为 函数 声明 ， 从 而 让 my thread 被 声 
明 为 std: :thread 类 型 的 变量 。 第 二 个 例子 @ 使 用 新 的 统一 初始 化 语法 ， 用 大 括号 而 不 
是 括号 ， 同 样 也 是 声明 一 个 变量 。 
| 有 一 种 避免 了 此 问题 的 可 调用 对 象 类 型 , 就 是 lambda 表达 式 Clambda expression), 
这 是 CHIL 中 的 一 项 新 功能 , 其 基本 功能 是 允许 你 编写 一 个 局 部 函数 ， 并 可 能 捕捉 一 些 
局 部 变量 ， 同 时 避免 传递 额外 参数 的 需求 (参见 2.2 节 )。 有 关 lambda 表达 式 的 详情 ， 
请 参阅 附录 A 中 A.5 节 。 前 面 的 例子 可 以 用 lambda 表达 式 编写 如 下 。 


std::thread my_thread([] ( 
do something(); 
do something else(); 


M 

一 日 开始 了 线程 ， 你 需要 显 式 地 决定 是 要 等 待 它 完成 (通过 结合 它 一 一 参见 2.12 
节 )， 还 是 让 它 自行 运行 (通过 分 离 它 一 一 参见 2.1.3 节 )。 如 果 你 在 std: :thread 对 
象 被 销毁 前 未 作 决 定 ， 那 么 你 的 程序 会 被 终止 (std: :thread 的 析 构 函数 调用 
std::terminate())。 因 此 ， 即 便 在 异常 存在 的 情况 下 ， 确 保 线程 正确 地 结合 或 是 分 
离 都 是 你 的 当务之急 。 请 参见 2.1.3 节 中 处 理 这 一 场景 的 技巧 。 需 要 注意 的 是 ， 你 只 需 
要 在 std: :thread 对 象 被 销毁 之 前 做 出 这 个 决定 即 可 一 一 线程 本 身 可 能 在 你 结合 或 
分 离 它 之 前 早 就 已 经 结束 了 ， 而 且 如 果 你 分 离 它 ， 那 么 该 线程 可 能 在 std: :thread 对 
象 被 销毁 后 很 久 都 还 在 运行 。 

如 果 你 不 等 待 线程 完成 ， 那 么 你 需要 确保 通过 该 线程 访问 的 数据 是 有 效 的 ， 直 到 该 
线程 完成 为 止 。 这 并 不 是 新 间 题 一 一 即使 是 在 单线 程 代码 中 ， 在 对 象 被 销毁 后 还 访问 它 
也 是 未 定义 的 行为 一 一 但 线程 的 使 用 提供 了 遇 到 这 种 生命 周期 间 题 的 额外 机 会 。 

你 可 能 遇 到 这 样 问题 的 一 种 情况 是 ， 当 线程 函数 持 有 局 部 变量 的 指针 或 引用 ， 且 当 
函数 退出 的 时 候 线程 尚未 完成 时 ， 清 单 2.1 展示 的 就 是 这 样 一 个 场景 的 例子 。 


清单 2.1 


struct func 


{ 


当 线程 仍然 访问 局 部 变量 时 返回 的 函数 


inte i; 


func(int& i ):i(i )() 
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void operator()() 


for(unsigned j=0;j<1000000;++j) 
XE [LH RTRERA 
do something (i); 访问 
} 
hs 


void oops () 
int some local state-0; 


func my func(some local state); 


不 等 待 线程 
Std::thread my thread(my func); 完成 新 的 线程 可 能 仍 在 
运行 


my thread.detach(); 


在 这 种 情况 下 , 当 oops 退出 @ 时 与 my_thread 相关 联 的 新 线程 可 能 仍然 在 运行 ， 
因为 通过 调用 detach () @ 你 已 经 显 式 地 决定 不 等 待 它 。 如 果 线 程 仍 在 运行 ， 则 在 下 次 
调用 do something (i) @ 时 就 会 访问 一 个 已 被 销毁 的 变量 。 这 就 像 普通 的 单线 程 代码 
那样 一 一 允许 对 局 部 变量 的 指针 或 引用 持续 到 函数 退出 之 后 绝 不 是 一 个 好 主意 一 一 但 
对 于 多 线程 代码 更 容易 犯 这 样 的 错误 ， 因 为 当 它 发 生 的 时 候 ， 并 不 一 定 是 显而易见 的 。 

一 个 常见 的 处 理 这 种 情况 的 方式 是 使 线程 函数 自 包含 ， 并 且 把 数据 复制 (copy) 到 
该 线程 中 而 不 是 共享 数据 。 如 果 你 为 线程 函数 使 用 了 一 个 可 调用 对 象 ， 该 对 象 本 身 被 复 
制 到 该 线程 中 ， 那 么 原始 对 象 就 可 以 立即 被 销毁 。 但 是 你 仍然 需要 警惕 包含 有 指针 或 引 
用 的 对 象 ， 就 像 上 面 的 清单 2.1 那样 。 特 别 地 ， 在 一 个 访问 局 部 变量 的 函数 中 创建 线程 
是 个 糟糕 的 主意 ， 除 非 能 保证 线程 在 函数 退出 前 完成 。 

另外 ， 通 过 结合 〈joining) 线程 ， 你 可 以 确保 在 函数 退出 前 ， 该 线程 执行 完毕 。 


2.1.2 等待 线程 完成 


如 果 你 需要 等 待 线程 完成 ， 你 可 以 通过 在 相关 联 的 std::thread 实例 上 调用 
join () 来 实现 。 在 清单 2.1 的 情况 下 ， 把 函数 体 右 括号 前 对 my thread.detach() 
的 调用 替换 为 调用 my_thread.join() ， 就 将 足以 确保 在 函数 退出 之 前 ， 即 局 部 变量 
被 销毁 之 前 ， 该 线程 就 已 结束 。 在 这 种 情况 下 ， 就 意味 着 在 独立 的 线程 上 运行 函数 是 没 
什么 意义 的 , 因为 第 一 个 线程 在 此 期 间 将 做 不 了 任何 有 用 的 事情 , 但 在 实际 的 代码 当中 ， 
初始 线程 可 能 要 么 有 自己 的 工作 去 做 , 要 么 是 在 等 待 所 有 线程 完成 之 前 就 要 启动 多 个 线 
程 来 做 有 用 的 工作 。 

join () 很 简单 也 很 暴力 一 一 你 要 么 等 待 一 个 线程 完成 要 么 就 不 等 。 如 果 你 需要 对 
等 待 线程 进行 更 细 粒 度 的 控制 ， 比 如 检查 线程 是 否 完成 , 或 只 是 在 一 段 特定 的 时 间 内 进 
TSF, 那么 就 必须 使 用 蔡 代 机 制 ， 例 如 条 件 变量 和 future， 我 们 将 在 第 4 章 中 提 到 。 
调用 join O 的 行为 也 会 清理 所 有 与 该 线程 相关 联 的 存储 器 , 这 样 std: :thread HR 
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不 再 与 现 已 完成 的 线程 相关 联 ， 它 也 不 与 任何 线程 相关 联 。 这 就 意味 着 ， 你 只 能 对 一 个 
给 定 的 线程 调用 一 次 join () ， 一 旦 你 调用 了 join ()， 此 std: :thread 对 象 不 再 是 
可 连接 的 ， 并 且 joinable () 将 返回 false。 


21.3 ”在 异常 环境 下 的 等 待 


如 前 所 述 , 你 要 确保 在 std: :thread 对 象 被 销毁 前 已 调用 join () 或 detach () 
函数 。 如 果 要 分 离线 程 ， 通 常 在 线程 启动 后 就 可 以 立即 调用 detach () ， 所 以 这 不 是 个 
问题 。 但 是 如 果 打算 等 待 该 线程 ， 就 需要 仔细 地 选择 在 代码 的 哪个 位 置 调用 join () 。 
这 意味 着 ， 如 果 在 线程 开始 之 后 但 又 是 在 调用 join O 之 前 引发 了 异常 ， 对 join() 的 
调用 就 容易 被 跳 过 。 

为 了 避免 应 用 程序 在 引发 异常 的 时 候 被 终止 ， 你 需要 在 这 种 情况 决定 要 做 什么 。 一 
般 来 说 ， 如 果 你 打算 在 非 异常 的 情况 下 调用 join ()， 你 还 需要 在 存在 异常 时 调用 
join () ， 以 避免 意外 的 生命 周期 间 题 。 清 单 2.2 展示 了 这 样 的 简单 代码 。 


清单 2.2 等待 线程 结束 


struct func; 参见 清单 2.1 中 的 
vota £4) 定义 
{ 


int some local state-0; 

func my func(some local state); 
std::thread t(my func); 

try 


{ 


do something in current thread(); 


) 


catch...) 
{ 
t.join(); «— 
throw; 
) 
t.join(); +O 
} 
清单 2.2 中 的 代码 使 用 了 try/catch Et, 以 确保 访问 局 部 状态 的 线程 在 函数 退 
出 前 结束 ， 无 论 函数 是 正常 退出 @ 还 是 异常 @ 中 断 。 使 用 try/catch ugue MR, mHE. 
容易 将 作用 域 弄 乱 ， 所 以 并 不 是 一 个 理想 的 方案 。 如 果 确 保 线程 必须 在 函数 退出 前 完成 
是 很 重要 的 一 一 无 论 是 因为 它 具有 对 其 他 局 部 变量 的 引用 还 是 任何 其 他 原因 一 一 那么 
确保 这 是 所 有 可 能 的 退出 路 径 的 情况 是 很 重要 的 ， 无 论 正常 还 是 异常 ， 并 且 和 希望 提供 一 
个 这 样 做 的 简单 明了 的 机 制 。 
这 样 做 的 方法 之 一 是 使 用 标准 的 资源 获取 即 初始 化 (RAIT) 惯用 语法 ， 并 提供 一 个 
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类 , 在 它 的 析 构 函数 中 进行 join O , 正如 清单 2.3 的 代码 。 看 看 它 是 如 何 简化 函数 f£() 的 。 


清单 2.3 (EA RAI 等 待 线程 完 


class thread guard 
Std::thread& t; 


public: 
explicit thread guard(std::thread& t ): 


-thread guard() 


if (t.joinable()) «99 
{ 
t.join(); +0 
} 
) à 
thread guard (thread guard const&) =delete; -© 


thread guard& operator=(thread guard const&)-delete; 


s 
struct func; - 参见 清单 2.1 中 的 
定义 


void £0 
{ 
int some_local_state=0; 
func my_func(some_local_state) ; 
std::thread t (my_func) ; 
thread guard g(t); 


do something in current thread(); 


) «0 


在 当前 线程 的 执行 到 达 £ REON, Jer HOUR A UPS s BRECHA Pe B BR 
Wb, thread guard YR g 首先 被 销毁 ， 并 且 析 构 函 数 @ 中 线程 被 结合 。 即 便 
是 当 函 数 因 do something in current thread 引发 异常 而 退出 的 情况 下 也 
会 发 生 。 

在 清单 2.3 中 的 析 构 函数 在 调用 join O @ 前 首先 测试 thread_guard 的 析 构 函数 
是 不 是 joinable () @ 的 。 这 很 重要 ， 因 为 对 于 一 个 给 定 的 执行 线程 join () 只 能 被 调 
用 一 次 ， 所 以 如 果 线 程 已 经 被 结合 ， 这 样 做 就 是 错误 的 。 

拷贝 构造 函数 和 拷贝 赋值 运算 符 被 标记 =delete@，, 以 确保 他 们 不 会 由 编译 器 自动 
提供 。 复 制 或 赋值 这 样 一 个 对 象 可 能 是 危险 的 ， 因 为 它 可 能 比 它 要 结合 的 线程 的 作用 域 
存在 得 更 久 。 通 过 将 它们 声明 为 已 删除 的 ， 任 何 复制 thread guard 对 象 的 企图 都 将 
产生 编译 错误 。 参 见 附录 A 中 A.2 节 ， 了 解 更 多 关于 已 删除 的 函数 。 

如 果 无 需 等 待 线程 完成 ， 可 以 通过 分 离 〈detaching ) 它 来 避免 这 种 异常 安全 问题 。 
这 打破 了 线程 与 std::thread 对 象 的 联系 并 确保 当 std::thread 对 象 被 销毁 时 
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std::terminate () 不 会 被 调用 ， 即使 线程 仍 在 后 台 运 行 。 


2.1.4 在 后 台 运 行 线程 


在 std: : thread 对 象 上 调用 detach () 会 把 线程 丢 在 后 台 运 行 ， 也 没有 直接 的 方 
法 与 之 通信 。 也 不 再 可 能 等 待 该 线程 完成 ， 如 果 一 个 线程 成 为 分 离 的 ， 获取 一 个 引用 它 
W std: :thread 对 象 也 是 不 可 能 的 ， 所 以 它 也 不 再 能 够 被 结合 。 分 离 的 线程 确实 是 在 
后 台 运 行 所 有 权 和 控制 权 被 转交 给 C++ 运行 时 库 ， 以 确保 与 线程 相 关联 的 资源 在 线程 
退出 后 能 够 被 正确 地 回收 。 

SR UNIX 的 守护 进程 (daemon process) 概念 ， 被 分 离 的 线程 通常 被 称 为 守护 线 
程 (daemon threads)， 它 们 无 需 任 何 显 式 的 用 户 界面 ， 而 运行 在 后 台 。 这 样 的 线程 通 
党 是 长 时 间 运 行 的 ,它们 可 能 在 应 用 程序 的 几乎 整个 生命 周期 中 都 在 运行 ， 执行 后 台 任 
务 , 例如 监控 文件 系统 、 清除 对 象 缓存 中 的 未 使 用 项 或 是 优化 数据 结构 。 在 另 一 个 极端 ， 
有 另 一 种 鉴别 线程 何 时 完成 的 机 制 ， 或 者 线程 被 用 作 “ 即 用 即 忘 ”任务 ， 在 这 里 使 用 分 
离线 程 也 是 有 意义 的 。 

如 你 在 2.1.2 节 中 已 经 看 到 的 ， 你 通过 调用 std: :thread 对 象 的 detach () 的 成 
员 函 数 来 分 离线 程 。 在 调用 完成 后 ，std: :thread 对 象 不 再 与 执行 的 实际 线程 相关 联 ， 
同时 也 不 能 够 被 加 入 。 


std::thread t(do background work); 
t.detach(); 
assert(!t.joinable()); 


为 了 从 一 个 std: thread 对 象 中 分 离线 程 , 必须 有 一 个 线程 供 分 离 。 你 不 能 在 一 
个 没有 与 执行 线程 相关 联 的 std: :thread 对 象 上 调用 detach O 。 这 对 于 join () 也 
是 同样 的 要 求 ， 你 可 以 用 完全 相同 的 方法 进行 检查 一 一 你 只 能 在 t .joinable () 返回 
true 的 时 候 ， 为 一 个 std: :thread KAR t HA t.detach(), 

考虑 二 个 类 似 于 字 处 理 器 的 应 用 程序 ， 它 可 以 一 次 编辑 多 个 文档 。 有 许多 种 方 
法 在 UI 级 别 和 内 部 来 处 理 这 个 问题 。 有 一 种 现在 看 起 来 越 来 越 普遍 的 方式 ， 是 具 
有 多 个 相互 独立 的 顶层 窗口 ,与 正在 编辑 的 文档 一 一 对 应 。 尽 管 这 些 窗 口 看 起 来 完 
全 独立 , 各自 拥有 自己 的 菜单 等 ， 但 它们 是 在 同一 个 应 用 程序 的 实例 上 运行 的 。 一 
种 在 内 部 处 理 这 个 问题 的 方式 是 在 其 自己 的 线程 中 运行 各 自 的 文档 编辑 窗口 ; 每 个 
线程 都 运行 相同 的 代码 ， 但 拥有 与 被 编辑 文档 相关 的 不 同 的 数据 以 及 相应 的 窗口 属 
性 。 打开 一 个 新 的 文档 就 需要 启动 一 个 新 的 线程 。 处 理 请 求 的 线程 并 不 在 乎 等 待 其 
他 的 线程 完成 ,因为 它 在 一 个 不 相关 的 文件 上 工作 ， 所 以 运行 分 离 的 线程 就 成 为 了 
首选 。 

清单 2.4 展示 了 这 种 方法 的 简单 的 代码 大 纲 。 
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清单 2.4 ”分 离线 程 以 处 理 其 他 文档 


void edit_document (std::string const& filename) 


open document and display gui (filename); 
while(!done editing()) 
{ 
user_command cmd=get_user_input () ; 
if (cmd.type--open new document) 
{ 
std::string const new name-get filename from user(); 
std::thread t(edit document,new name); EX 1) 


t.detach(); «99 
} 


else 


{ 


} 
} 


process_user_input (cmd) ; 


} 


如 果 用 户 选择 打开 一 个 新 的 文档 ， 它 会 提示 其 有 文档 要 打开 ， 启 动 新 线程 来 打开 该 
文档 @， 然 后 分 离 它 @。 因 为 新 的 线程 与 当前 线程 做 着 同样 的 操作 ， 只 是 文件 不 同 ， 你 
可 以 用 新 选 定 的 文件 名 作为 参数 ， 重 用 同一 个 函数 (edit document), 

这 个 例子 还 展示 了 一 个 案例 ， 它 有 助 于 传递 参数 给 用 来 启动 线程 的 函数 : 并非 仅仅 
将 函数 名 传递 给 std: : thread 构造 函数 @， 你 还 可 以 传递 文件 名 参数 。 虽 然 也 有 其 他 
机 制 能 够 做 到 这 一 点 ， 例 如 使 用 具有 成 员 数据 的 函数 对 象 取代 普通 的 带 有 参数 的 函数 ， 
但 线程 库 提供 了 一 个 简单 方法 来 实现 之 。 


传递 参数 给 线程 函数 


如 清单 2.4 中 所 示 ， 传 递 参数 给 可 调用 对 象 或 函数 ， 基 本 上 就 是 简单 地 将 额外 的 参 
数 传递 给 std::thread 构造 函数 。 但 重要 的 是 , 参数 会 以 默认 的 方式 被 复制 (copied) 
到 内 部 存储 空间 ， 在 那里 新 创建 的 执行 线程 可 以 访问 它们 ， 即 便 函 数 中 的 相应 参数 期 待 
着 引用 。 这 里 有 一 个 简单 的 例子 。 


void f(int i,std::string const& s); 
Std::thread t(f,3,"hello"); 


这 里 创建 一 个 新 的 与 t 相关 联 的 执行 线程 ， 称 为 (3， "hello") 。 注 意 即使 f 
接受 std: :string 作为 第 二 个 参数 ， 字 符 串 字面 值 仅 在 新 线程 的 上 下 文中 才 会 作为 
char const* 传 送 ， 并 转换 为 std: :string。 尤 其 重要 的 是 当 提 供 的 参数 是 一 个 自 
动 变量 的 指针 时 ， 如 下 所 示 。 
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void f(int i,std::string const& s); 


void oops(int some param) 


char buffer [1024]; 0 
sprintf (buffer, "%i",some_param) ; 
std::thread t(f,3,buffer); +O 
t.detach(); 


} 

在 这 种 情况 下 ， 正 是 局 部 变量 buffer@ 的 指针 被 传递 给 新 线程 @， 还 有 一 个 重要 
的 时 机 ， 即 函数 oops 会 在 缓冲 在 新 线程 上 被 转换 为 Std: : string 之 前 退出 ， 从 而 导 
致 未 定义 的 行为 。 解 决 之 道 是 在 将 缓冲 传递 给 std: :thread 的 构造 函数 之 前 转换 为 
stdsrstring, 
void f(int i,std::string const& sS); 


void not oops(int some param) 


{ 


char buffer [1024]; 


sprintf (buffer,"$i",some param); ja 使 用 std::string 避免 悬浮 
Std::thread t(f,3,std::string(buffer)); 指针 
t.detach(); 


} 

在 这 种 情况 下 , 问题 就 出 在 你 依赖 从 缓冲 的 指针 到 函数 所 期 望 的 std: : string 对 
象 的 隐 式 转换 ,因为 std: :thread 构造 函数 原样 复制 了 所 提供 的 值 ， 并 未 转换 为 期 户 
的 参数 类 型 。 

也 有 可 能 得 到 相反 的 情况 ， 对 象 被 复制 ， 而 你 想 要 的 是 引用 。 这 可 能 发 生 在 当 线程 
正在 更 新 一 个 通过 引用 传递 来 的 数据 结构 时 ， 例 如 ， 
void update data for widget (widget id w,widget data& data); 0 


void oops again(widget id w) 


widget data data; 


std::thread t(update data for widget,w,data); -© 
display status(); 

bes oy Bee St) I 

process widget data (data); «-e9 


} 

尽管 update data for widget@ 希 望 通过 引用 传递 第 二 个 参数 , std: :thread 
的 构造 函数 @ 却 并 不 知道 ， 它 无 视 函 数 所 期 望 的 类 型 ， 并 且 盲 目地 复制 了 所 提供 的 
值 。 当 它 调用 update data for widget 时 ， 它 最 后 将 传递 data 在 内 部 的 副本 
的 引用 而 非 对 data 自身 的 引用 。 于 是 ， 当 线程 完成 时 ， 随 着 所 提供 参数 的 内 部 副 
本 的 销毁 ， 这 些 改 动 都 将 被 舍弃 ， 将 会 传递 一 个 未 改变 的 datae, 而 非 正 确 更 新 的 版 本 
给 process widget data, 对 于 熟悉 std: :bind 的 人 来 说 , 解决 方案 也 是 显而易见 的 ， 
你 需要 用 std: : ref 来 包装 确实 需要 被 引用 的 参数 。 在 这 种 情况 下 ， 如 果 你 将 对 线程 的 调 
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用 改 为 


Std::thread t(update data for widget,w,std::ref(data)); 


那么 update data for widget 将 被 正确 地 传人 data 的 引用 ,而 非 data 副本 
(copy) 的 引用 。 

如 果 你 熟悉 std: :bind， 那 么 参数 传递 语义 就 不 足 为 奇 ， 因 为 std: :thread fj 
HRSA std: :bind 的 操作 都 是 依据 相同 的 机 制定 义 的 。 这 意味 着 , 例如， 你 可 以 传 
递 一 个 成 员 函 数 的 指针 作为 函数 ， 前 提 是 提供 一 个 合适 的 对 象 指 针 作为 第 一 个 参数 。 


class X 


{ 
public: 

void do lengthy work(); 
IE 


X my x; 
std::thread t(&X::do lengthy work, &my x); 0 


这 段 代码 将 在 新 线程 上 调用 my x.do lengthy work(), 因为 my_x 的 地 址 是 作 
为 对 象 指针 包 提 供 的 。 你 也 可 以 提供 参数 给 这 样 的 成 员 函 数 调用 :std: :thread 构造 
函数 的 第 三 个 参数 将 作为 成 员 函 数 的 第 一 个 参数 等 等 。 

提供 参数 的 另 一 个 有 趣 的 场景 是 ， 这 里 的 参数 不 能 被 复制 但 只 能 被 移动 (moved): 
一 个 对 象 内 保存 的 数据 被 转移 到 另 一 个 对 象 ， 使 原来 的 对 象 变 成 “ 空 达 ”。 这 种 类 型 的 
一 个 例子 是 sta: :unique_ptr， 它 提供 了 动态 分 配对 象 的 自动 内 存 管理 。 只 有 一 个 
std::unique ptr 实例 可 以 在 某 一 时 刻 指向 一 个 给 定 的 对 象 ， 当 该 实例 被 销毁 时 ,其 
指向 的 对 象 将 被 删除 。 移 动 构造 函数 (move constructor) 和 移动 赋值 运算 符 〈move 
assignment operator) 允许 一 个 对 象 的 所 有 权 在 std: :unique ptr 实例 之 间 进 行 转移 
(参见 附录 A 中 A.1.1 节 ， 关 于 移动 语义 的 详情 )。 这 种 转移 给 源 对 象 留 下 一 个 NULL 指 
针 。 这 种 值 的 移动 使 得 该 类 型 的 对 象 作为 函数 的 参数 被 接受 或 从 函数 返回 值 。 在 源 对 象 
是 临时 的 场合 ， 这 种 移动 是 自动 的 , 但 在 源 是 一 个 命名 值 的 地 方 ， 此 转移 必须 直接 通过 
调用 std: :move O 来 请 求 。 下 面 的 示例 展示 了 运用 sta: :move 将 动态 对 象 的 所 有 权 
转移 到 一 个 线程 中 。 
void process big object(std::unique ptr«big object»); 


std: :unique ptr«big object» p(new big object); 
p-»prepare data(42); 
Std::thread t(process big object,std::move(p)); 


通过 在 std::thread 构造 函数 中 指定 std::move(p), big object 的 所 有 权 
先 被 转移 进 新 创建 的 线程 的 内 部 存储 中 ， 然 后 进入 process big object, 

标准 线程 库 中 的 一 些 类 表现 出 与 std: :unique_ptr 相同 的 所 有 权 语义 , std: : 
thread 就 是 其 中 之 一 。 虽 然 std::thread 实例 并 不 拥有 与 std::unique ptr 
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同样 方式 的 动态 对 象 ， 但 他 们 却 拥有 资源 ， 每 一 个 实例 负责 管理 一 个 执行 线程 。 这 
种 所 有 权 可 以 在 实例 之 间 进 行 转移 ， 因 为 std::thread 的 实例 是 可 移动 的 
Cmovable)， 即 使 他 们 不 是 可 复制 的 《copyable)。 这 确保 了 在 允许 程序 员 选 择 在 对 
象 之 间 转 换 所 有 权 的 时 候 ， 在 任意 时 刻 只 有 一 个 对 象 与 某 个 特定 的 执行 线程 相 
关联 。 


转移 线程 的 所 有 权 


假设 你 想 要 编写 一 个 函数 ， 它 创建 一 个 在 后 台 运 行 的 线程 ， 但 是 向 调用 函数 回 传 新 
线程 的 所 有 权 ， 而 非 等 待 其 完成 ， 又 或 者 你 想 要 反 过 来 做 ， 创 建 一 个 线程 ， 并 将 所 有 权 
传递 给 要 等 待 它 完成 的 函数 。 在 任意 一 种 情况 下 ， 你 都 需要 将 所 有 权 从 一 个 地 方 转移 到 
另 一 个 地 方 ; 

这 里 就 是 sta: :thread 支持 移动 的 由 来 。 正如 在 上 一 节 所 描述 的 , 在 C++ 标准 库 
里 许多 拥有 资源 的 类 型 ， 如 std::ifstream 和 std ::unique ptr 是 可 移动 的 
(movable)， 而 非 可 复制 的 (copyable)， 并 且 std: :thread 就 是 其 中 之 一 。 这 意味 着 
一 个 特定 执行 线程 的 所 有 权 可 以 在 std: :thread 实例 之 间 移 动 ， 如 同 接 下 来 的 LT. 
该 示例 展示 了 创建 两 个 执行 线程 ， 以 及 在 三 个 std: :thread 实例 t1, t2 Al t3 之 间 
对 那些 线程 的 所 有 权 进 行 转移 。 


void some function(); 

void some other function(); 

std::thread ti1(some function); 0 
std::thread t2=std: :move (t1); 
tl-std::thread(some other function); -© 
std::thread t3; 


«o0 
t3sstd::move (t2) ; 0 9 此 赋值 将 终结 程序 ! 


tl-std::move (t3); 


首先 ， 启 动 一 个 新 线程 @ 并 与 tl 相关 联 。 然 后 当 c2 构建 完成 时 所 有 权 被 转移 给 
t2， 通 过 调用 std: :move O 来 显 式 地 转移 所 有 权 @。 此 刻 ，t1 不 再 拥有 相关 联 的 执 
行 线程 ， 运 行 some function 的 线程 现在 与 +2 相关 联 。 

然后 ， 启 动 一 个 新 的 线程 并 与 一 个 临时 的 std: : thread 对 象 相关 联 @@。 接 下 来 将 
所 有 权 转 移 到 t1 中 ， 是 不 需要 调用 std::move () 来 显 式 移动 所 有 权 的 ， 因 为 此 处 所 
有 者 是 一 个 临时 对 象 一 一 从 临时 对 象 中 进行 移动 是 自动 和 隐 式 的 。 

t3 是 默认 构造 的 @， 这 意味 着 它 的 创建 没有 任何 相关 联 的 执行 线程 。 当 前 与 t2 相 
关联 的 线程 的 所 有 权 转 移 到 t3@， 再 次 通过 显 式 调用 std: :move () ,因为 t2 是 一 个 
命名 对 象 。 在 所 有 这 些 移动 之 后 ，t1 与 运行 some other function 的 线程 相关 联 ， 
t2 没有 相关 联 的 线程 ，t3 与 运行 some function 的 线程 相关 联 。 

最 后 一 次 移动 @ 将 运行 some_function 的 线程 的 所 有 权 转 回 给 t1。 但 是 在 这 种 
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情况 下 tl 已 经 有 了 一 个 相关 联 的 线程 (运行 着 some other function), MUSH 
用 std: :terminate() 来 终止 程序 。 这 样 做 是 为 了 与 std: :thread 的 析 构 函数 保持 
一 致 。 你 在 第 2.1.1 节 曾 看 到 ， 你 必须 在 析 构 前 显 式 地 等 待 线程 完成 或 是 分 离 ， 这 同样 
适用 于 赋值 : 你 不 能 仅仅 通过 向 管理 一 个 线程 的 std: : thread 对 象 赋值 一 个 新 的 值 来 
“舍弃 ”一 个 线程 。 

std: :thread 支持 移动 意味 着 所 有 权 可 以 很 容易 地 从 一 个 函数 中 被 转移 出 ， 如 清 
单 2.5 所 示 。 


清单 2.5 ”从 函数 中 返回 std::thread 
std::thread f() 


void some function(); 
return std::thread(some function); 


Std::thread g() 


void some other function(int); 
Std::thread t(some other function,42); 
return, ot 


同样 地 ,如 果 要 把 所 有 权 转 移 到 函数 中 ,， 它 只 能 以 值 的 形式 接受 std: : thread 的 
实例 作为 其 中 一 个 参数 ， 如 下 所 示 。 


void f(std::thread t); 

void g() 

{ 
void some function(); 
f(std::thread(some function)); 
Std::thread t (some function); 
f(std::move(t)); 


std::thread 支持 移动 的 好 处 之 一 ， 就 是 你 可 以 建立 在 清单 23 m 
thread guard 类 的 基础 上 ， 同 时 使 它 实 际 上 获得 线程 的 所 有 权 。 这 可 以 避免 
thread guard 对 象 在 引用 它 的 线程 结束 后 继续 存在 所 造成 的 不 良 影 响 ， 同 时 也 意味 
着 一 旦 所 有 权 转 移 到 了 该 对 象 ， 那么 其 他 对 象 都 不 可 以 结合 或 分 离 该 线程 。 因 为 这 主要 
是 为 了 确保 在 退出 一 个 作用 域 之 前 线程 都 已 完成 ， 我 把 这 个 类 称 为 scoped_thread， 
其 实现 如 清单 2.6 所 示 ， 同 时 附带 一 个 简单 的 示例 。 


清单 2.6 scoped thread 和 示例 用 法 


class scoped thread 


{ 
Std::thread t; 
public: 
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ó 


explicit scoped thread(std::thread kie 
t(std::move(t )) 
{ 


if(!t.joinable()) 
throw std::logic error("No thread"); 


) 


-Scoped thread() 


{ 
t:join(: -© 
} 
scoped thread(scoped thread const&)-delete; 
scoped thread& operators (scoped thread const&) =delete; 


}i 


struct func; 参见 清 
void f() 单 2.1 
{ 


int some local. state; 
scoped thread t(std::thread(func(some local state))); +@ 


do something in current thread(); 


} 0 

这 个 例子 与 清单 2.3 类 似 ， 但 是 新 线程 被 直接 传递 到 scoped_thread@， 而 不 是 
为 它 创建 一 个 单独 的 命名 变量 。 当 初始 线程 到 达 f@ 的 结尾 时 ，scoped_thread HR 
被 销毁 ， 然 后 结合 上 提供 给 构造 函数 @ 的 线程 。 使 用 清单 2.3 中 的 thread guard 类 ， 
析 构 函数 必须 检查 线程 是 不 是 仍然 可 结合 ， 你 可 以 在 构造 函数 中 @ 来 做 ， 如 果 不 是 则 引 
发 异常。 

std: :thread 对 移动 的 支持 同样 考虑 了 std: thread 对 象 的 容器 ， 如果 那些 容 
器 是 移动 感知 的 (如 更 新 后 的 std: : vector<>)。 这 意味 着 你 可 以 编写 像 清 单 2.7 中 的 
代码 ， 生 成 一 批 线程 ， 然 后 等 待 它们 完成 。 


清单 2.7 生成 一 批 线程 并 等 待 它们 完成 
void do work(unsigned id); 


void f() 


( 
std::vector«std::thread» threads; 
for (unsigned i=0;i<20;++1) 


{ e 生成 线程 


threads.push back(std::thread(do work,i)); 
) 


std::for each(threads.begin(),threads.end(), 轮流 在 每 个 线程 上 
std::mem fn(&std::thread::join)); 调用 join) 


) 


如 果 线 程 是 被 用 来 细 分 某 种 算法 的 工作 ， 这 往往 正 是 所 需 的 。 在 返回 调用 者 之 前 ， 
所 有 线程 必须 全 都 完成 。 当 然 ， 清 单 2.7 的 简单 结构 意味 着 由 线程 所 做 的 工作 是 自 包含 
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的 ， 同 时 它们 操作 的 结果 纯粹 是 共享 数据 的 副作用 。 如 果 £O 向 调用 者 返回 一 个 依赖 于 
这 些 线程 的 操作 结果 的 值 ， 那 么 正如 所 写 的 这 样 ， 该 返回 值 就 得 通过 检查 线程 终止 后 的 
共享 数据 来 决定 。 在 线程 问 转移 操作 结果 的 蔡 代 方案 将 在 第 4 章 中 讨论 。 

将 std: : thread 对 象 放 到 std: :vector 中 是 线程 迈 向 自动 管理 的 一 步 。 与 其 为 
那些 线程 创建 独立 的 变量 并 直接 与 之 结合 ， 不 如 将 它们 视 为 群 组 。 你 可 以 进一步 创建 在 
运行 时 确定 的 动态 数量 的 线程 ， 更 进一步 地 利用 这 一 步 ， 而 不 是 如 清单 2.7 中 的 那样 创 
建 固定 的 数量 。 


在 运行 时 选择 线程 数量 


C++ 标准 库 中 对 此 有 所 帮助 的 特性 是 std: :thread::hardware currency(), 
这 个 函数 返回 一 个 对 于 给 定 程 序 执行 时 能 够 真正 并 发 运行 的 线程 数量 的 指示 。 例 如 , 在 
多 核 系统 上 它 可 能 是 CPU 核心 的 数量 。 它 仅仅 是 一 个 提示 ， 如 果 该 信息 不 可 用 则 函数 
可 能 会 返回 0， 但 它 对 于 在 线程 间 分 割 任务 是 一 个 有 用 的 指南 。 

清单 2.8 展示 了 std: :accumulate 的 一 个 简单 的 并 行 版 本 实现 。 它 在 线程 之 间 划 
分 所 做 的 工作 ， 使 得 每 个 线程 具有 最 小 数目 的 元 素 以 避免 过 多 线程 的 开销 。 请 注意 ， 该 
实现 假定 所 有 的 操作 都 不 引发 异常 ， 即 便 异常 可 能 会 发 生 。 例 如 ，stq: :thread 构造 
函数 如 果 不 能 启动 一 个 新 的 执行 线程 那么 它 将 引发 异常 。 在 这 样 的 算法 中 处 理 异 常 超出 
了 这 个 简单 示例 的 范围 ， 将 放 在 第 8 SEP IRIS, 


清单 2.8 std::accumulate 的 简单 的 并 行 版 本 


template<typename Iterator,typename T> 
struct accumulate block 


{ 


void operator() (Iterator first,Iterator last,T& result) 


{ 


result=std: :accumulate(first,last, result) ; 
} 
m 
template«typename Iterator,typename T» 
T parallel accumulate(Iterator first,Iterator last,T init) 


{ 


unsigned long const length=std::distance(first,last) ; 
if (!length) +@ 
return init; 


unsigned long const min per thread-25; 
unsigned long const max threads- 
(length«min per thread-1)/min per thread; +O 


unsigned long const hardware_threads= 
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std::thread::hardware concurrency () ; 


unsigned long const num threads- th 
std::min(hardware threads!-0?hardware threads:2,max threads); 


unsigned long const block size-length/num threads; 


std::vector<T> results(num threads); 
std::vector«std::thread» threads (num threads-1); -© 


Iterator block start=first; 
for (unsigned long i=0;i< (num threads-1) ;++i) 


Iterator block end=block start; 
std: :advance (block end,block size); +@ 
threads [i] =std: : thread ( +@ 
accumulate_block<Iterator,T>(), 
block start,block end,std::ref (results [i])); 
block start-block end; 


} 
accumulate _block<Iterator,T>() ( 
block_start, last, results [num_threads-1]) ; -© 
std::for each(threads.begin(),threads.end(), 
std::mem fn(&std::thread::join)); <0 
return std: :accumulate (results.begin(),results.end(),init); D 


} 

虽然 这 是 一 个 相当 长 的 函数 ， 但 它 实际 上 是 很 直观 的 。 如 果 输 入 范围 为 空 9 ， 只 返 
回 初始 值 init。 否 则 ， 此 范围 内 至 少 有 一 个 元 素 ， 于 是 你 将 要 处 理 的 元 素数 量 除 以 最 
小 的 块 大 小 ， 以 获取 线程 的 最 大 数量 ©, 这 是 为 了 避免 当 范围 中 只 有 五 个 值 时 ， 在 一 个 
32 核 的 机 器 上 创建 32 个 线程 。 

要 运行 的 线程 数 是 你 计算 出 的 最 大 值 和 硬件 线程 数量 目的 较 小 值 。 你 不 会 想 要 运行 比 
硬件 所 能 支持 的 更 多 的 线程 (超额 订阅 ，oversubscription)， 因为 上 下 文 切 换 将 意味 着 更 
多 的 线程 会 降低 性 能 。 如 果 对 std::thread::hardware concurrency () 的 调用 返 
回 0， 你 只 需 简单 地 替换 上 你 所 选择 的 数量 ， 在 这 个 例子 中 我 选择 了 2。 你 不 会 想 要 运行 
过 多 的 线程 ， 因 为 在 单 核 的 机 器 上 这 会 使 事情 变 慢 ， 但 同样 地 你 也 不 希望 运行 的 过 少 , 因 
为 那样 的 话 ， 你 就 会 错过 可 用 的 并 发 。 

每 个 待 处 理 的 线程 的 条 目 数量 是 范围 的 长 度 除 以 线程 的 数量 @。 如 果 你 担心 数量 不 
能 整除 ， 没 必要 一 一 稍 后 再 来 处 理 。 

既然 你 知道 有 多 少 个 线程 ， 你 可 以 为 中 间 结 果 创 建 一 个 std::vector<T>, 同时 
为 线程 创建 一 个 std::vector<std: :thread>@ 。 请 注意 ， 你 需要 启动 比 
num_threads 少 一 个 的 线程 ， 因 为 已 经 有 一 个 了 。 

启动 线程 是 个 简单 的 循环 : block end 迭代 器 到 当前 块 的 结尾 @， 并 启动 一 
个 新 的 线程 来 累计 此 块 的 结果 @。 下 一 个 块 的 开始 是 这 一 个 的 结束 @。 

当 你 启动 了 所 有 的 线程 后 ， 这 个 线程 就 可 以 处 理 最 后 的 块 @8。 这 就 是 你 处 理 所 
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有 未 被 整除 的 地 方 。 你 知道 最 后 一 块 的 结尾 只 能 是 last， 无 论 在 那个 块 里 有 多 少 元 
素 。 一 旦 累计 出 最 后 一 个 块 的 结果 ， 你 可 以 等 待 所 有 使 用 std: :for_each 生成 的 
线程 @， 如 清单 2.7 中 所 示 ， 接 着 通过 最 后 调用 std: :accumulate 将 结果 累加 起 
KO, 

在 你 离开 这 个 例子 前 ,值得 指出 的 是 在 类 型 T 的 加 法 运算 符 不 满足 结合 律 的 地 方 (如 
float 和 double), 这 个 parallel accumulate 的 结果 可 能 会 跟 std: :accumulate 
的 有 所 出 入 ， 这 是 将 范围 分 组 成 块 导致 的 。 此 外 ， 对 迭代 器 的 需求 要 更 严格 一 些 ， 它 们 必须 
至 少 是 前 向 迭代 器 (forward iterators)， 然 而 std: :accumulate 可 以 和 单 通 输入 迭代 
器 (input iterators) 一 起 工作 ,同时 T 必须 是 可 默认 构造 的 (default constructible) 
以 使 得 你 能 够 创建 results 向 量 。 这 些 需求 的 各 种 变化 是 并 行 算法 很 常见 的 ， 就 其 
本 质 而 言 ， 它 们 以 某 种 方式 的 不 同 是 为 了 使 其 并 行 ， 并 且 在 结果 和 需求 上 产生 影响 。 
并 行 算法 会 在 第 8 章 中 进行 更 深入 的 阐述 。 另 外 值得 一 提 的 是 ， 因 为 你 不 能 直接 从 一 
个 线程 中 返回 值 ， 所 以 你 必须 将 相关 项 的 引用 传人 results 向 量 中 。 从 线程 中 返回 
结果 的 替代 方法 ， 会 在 第 4 章 中 通过 使 用 future 来 实现 。 

在 这 种 情况 下 ,每 个 线程 所 需 的 所 有 信息 在 线程 开始 时 传人 ,包括 存储 其 计算 结果 
的 位 置 。 实 际 情况 并 非 总 是 如 此 。 有 时 ， 作 为 进程 的 一 部 分 有 必要 能 够 以 某 种 方式 标 
识 线程 。 你 可 以 传人 一 个 标识 数 ， 如 同 在 清单 2.7 中 i 的 值 ， 但 是 如 果 需 要 此 标识 符 
的 函数 在 调用 栈 中 深 达 数 个 层次 ,， 并且 可 能 从 任意 线程 中 被 调用 , 那样 做 就 很 不 方便 。 
当 我 们 设计 C++ 线程 库 时 就 预见 到 了 这 方面 的 需求 ， 所 以 每 个 线程 都 有 一 个 唯一 的 标 
识 符 。 


标识 线程 


线程 标识 符 是 std: :thread: :id 类 型 的 ， 并 且 有 两 种 获取 方式 。 其 一 ， 线 程 的 
标识 符 可 以 通过 从 与 之 相关 联 的 std: :thread 对 象 中 通过 调用 get. id O 成 员 函 数 来 
获得 。 如 果 std: : thread 对 象 没有 相关 联 的 执行 线程 ， 对 get. ia O 的 调用 返回 一 个 
默认 构造 的 std: :thread: :id 对象， 表示 “没有 线程 ”。 另 外 ， 当 前 线程 的 标识 符 ， 
可 以 通过 调用 std::this thread::get ia 0 获得 ， 这 也 是 定义 在 <thread> 头 文 
件 中 的 。 

std::thread::id 类 型 的 对 象 可 以 自由 地 复制 和 比较 ; 否则 , 它们 作为 标识 符 就 
没什么 大 用 处 。 如 果 两 个 std: :thread: :id 类 型 的 对 象 相等 ， 则 它们 代表 着 同一 个 
线程 ， 或 两 者 都 具有 “没有 线程 ”的 值 。 如 果 两 个 对 象 不 相等 ， 则 它们 代表 着 不 同 的 线 
程 ， 或 其 中 一 个 代表 着 线程 ， 而 另 一 个 具有 “没有 线程 ”的 值 。 

线程 库 不 限制 你 检查 线程 的 标识 符 是 否 相同 , std: : thread: :id 类 型 的 对 象 提供 
了 一 套 完整 的 比较 运算 符 ， 提 供 了 所 有 不 同 值 的 总 排序 。 这 就 允许 它们 在 关系 型 容器 中 
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被 用 作 主 键 ， 或 是 被 排序 ， 或 者 任何 作为 程序 员 的 你 认为 合适 的 方式 进行 比较 。 比 较 运 
算 符 为 std: :thread: :id 所 有 不 相等 的 值 提供 了 一 个 总 的 排序 ， 所 以 它们 表现 为 你 
直觉 上 期 望 的 那样 ; 如 果 a<b 且 <c, PA a<c， 等 等 。 标 准 库 还 提供 了 
std::hash<std::thtread::idq>, 使 得 std: :thread::id 类 型 的 值 可 在 新 的 无 序 
关系 型 容器 中 作为 主键 来 用 。 

std: :thread: :id 的 实例 常 被 用 来 检查 一 个 线程 是 否 需要 执行 某 些 操作 。 例 如 ， 
如 果 线 程 像 在 清单 2.8 中 那样 的 被 用 来 分 配 工作 ， 启 动 了 其 他 线程 的 初始 线程 在 需要 做 
的 工作 可 能 会 在 算法 中 略 有 不 同 。 在 这 种 情况 下 ， 它 可 以 在 启动 其 他 线程 之 前 存储 
std::this thread: :get_id() 的 结果 ， 然 后 算法 的 核心 部 分 〈 这 对 所 有 线程 都 是 
公共 的 ) 可 以 对 照 所 存储 的 值 来 检查 自己 的 线程 了 D。 
std: :thread: :id master thread; 


void some core part of algorithm() 


if(std::this thread::get id()--master thread) 


{ 
} 


do common work(); 


) 


do master thread work(); 


另外 ， 当 前 线程 的 std: :thread: :id 可 以 作为 操作 的 一 部 分 而 存储 在 数据 结构 
中 。 以 后 在 相同 数据 结构 上 的 操作 可 以 对 照 执行 此 操作 的 线程 ID 来 检查 所 存储 的 ID, 
来 确定 哪些 操作 是 允许 的 /需要 的 。 

类 似 地 ， 线 程 ID 可 以 指定 的 数据 需要 与 一 个 线程 进行 关联 ， 并 且 诸 如 线程 局 部 存 
储 这 样 的 替代 机 制 不 适用 的 地 方 ， 用 作 关 系 型 容器 的 主键 。 例 如 这 样 的 一 个 容器 ， 它 可 
以 被 控制 线程 用 来 存储 关于 在 它 控制 下 的 每 个 线程 的 信息 ， 或 是 在 线程 之 间 传 递 信息 。 

这 种 想法 就 是 ,在 大 多 数 情况 下 , std: :thread: :id 足以 作为 线程 的 通用 标识 符 。 
只 有 当 标 识 符 具有 与 其 相关 联 的 语义 (比如 作为 数组 的 索引 ) 时 , 才 有 必要 用 替代 方案 。 
你 甚至 可 以 将 一 个 std: thread: :id 实例 写 到 诸如 std::cout 这 样 的 输出 流 中 。 

std::cout««std::this thread::get id(); 

你 得 到 的 确切 的 输出 ， 严 格 取决 于 实现 ， 标 准 给 定 的 唯一 保证 是 ， 比 较 结果 相等 的 
线程 ID 应 该 产生 相同 的 输出 ， 而 那些 比较 结果 不 相等 的 应 该 给 出 不 同 的 输出 。 因 此 ， 
这 主要 是 对 调试 和 日 志 有 用 ， 但 数值 是 没有 语义 的 ， 所 以 也 没有 更 多 可 说 的 了 。 


小 结 


在 这 一 章 中 , 我 介绍 了 线程 管理 与 C++ 标准 库 的 基本 知识 : 启动 线程 , 等 待 其 完成 ， 
以 及 因为 你 希望 它们 在 后 台 运 行 而 不 等 待 其 完成 。 你 还 看 到 了 如 何在 线程 开始 时 将 参数 
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第 2 章 管理 线程 


传递 给 线程 函数 ， 如 何 将 管理 线程 的 责任 从 代码 的 一 个 部 分 转移 到 另 一 个 部 分 ， 以 及 如 
何 用 线程 组 来 做 分 配 工作 。 最 后 ， 我 讨论 了 标识 线程 ， 以 便 关联 数据 或 是 不 方便 通过 替 
代 方 法 进行 关联 的 特定 线程 的 行为 。 尽 管 你 可 以 使 用 运行 在 独立 数据 上 的 完全 独立 的 线 
程 做 很 多 事情 ， 例 如 在 清单 2.8 中 那样 ， 但 有 些 时 候 ， 当 线程 运行 时 在 它们 之 间 共 享 数 
据 是 更 理想 的 。 第 3 章 围 绕 直 接 在 线程 间 共 享 数据 进行 讨论 ,而 第 4 章 围绕 有 或 没有 共 
享 数 据 的 同步 操作 涵盖 更 一 般 性 的 问题 。 


第 3 HERD 


将 线程 用 作 并 行 的 关键 优点 之 一 ， 是 在 它们 之 间 简 单 、 直 接地 共享 数据 的 潜力 。 所 
以 既然 我 们 已 经 介绍 了 启动 和 管理 线程 ， 现 在 让 我 们 来 看 看 共享 数据 的 相关 问题 。 

假设 你 正 与 朋友 合租 着 一 套 公 寓 。 公 寓 里 只 有 一 个 厨房 和 一 间 浴 室 。 除 非 你们 特别 
的 友好 ， 否 则 你 们 不 能 同时 使 用 浴室 。 如 果 你 的 室友 长 时 间 占 据 着 浴室 ， 当 你 需要 用 它 
时 就 会 很 不 爽 。 同 样 地 ， 尽 管 两 人 同时 做 饭 也 是 可 以 的 ， 但 若是 你 们 有 一 个 组 合 烤箱 ， 
如 果 你 们 中 的 一 个 想 要 烤 香肠 而 另 一 个 想 要 烘 蛋 糕 ， 这 就 没 办 法 皆大欢喜 。 此 外 ， 大 家 
都 知道 共享 空间 的 挫败 感 ， 以 及 一 个 任务 做 到 一 半 才 发 现 有 人 借 走 了 我 们 需要 的 东西 ， 
或 者 某 件 东 西 无 意 中 被 别人 改变 了 。 

这 和 线程 是 相同 的 。 如 果 你 在 线程 之 间 共 享 数据 ， 你 需要 设置 规则 ， 哪 个 线程 可 以 
访问 数据 的 哪 一 位 ,什么 时 间 以 及 如 何 将 更 改 传达 给 关心 此 数据 的 其 他 线程 。 在 单个 进 
程 中 的 多 个 线程 之 间 可 以 轻易 地 共享 数据 不 单纯 是 优点 一 一 它 也 可 以 是 个 很 大 的 缺点 。 
共享 数据 的 不 正确 使 用 是 与 并 发 有 关 的 错误 的 最 大 诱因 之 一 ， 造成 的 后 果 可 比 香肠 味道 
的 蛋糕 糟 多 了 。 

本 章 涉及 了 在 C++ 线程 间 安全 地 共享 数据 ， 避 免 可 能 出 现 的 潜在 问题 ， 同 时 使 
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3.1 


第 3 章 ， 在 线程 间 共 享 数 据 


收益 最 大 化 。 


线程 之 间 共 享 数据 的 问题 


从 整体 上 来 看 ， 所 有 线程 之 间 共 享 数据 的 问题 ， 都 是 修改 数据 导致 的 。 如 果 所 
有 的 共享 数据 都 是 只 读 的 ， 就 没有 问题 ， 因 为 一 个 线程 所 读 取 的 数据 不 受 另 一 个 线 
程 是 否 正在 读 取 相 同 的 数据 而 影响 (If all shared data is read-only, there's no 
problem,because the data read by one thread is unaffected by whether or not 
another thread is reading the same data)。 然 而 ， 如 果 数 据 是 在 线程 之 间 共 享 的 ， 同 
时 一 个 或 多 个 线程 开始 修改 数据 ， 就 可 能 有 很 多 的 麻烦 。 在 这 种 情况 下 ， 你 必须 要 
小 心 确保 一 切 安 好 。 

一 个 被 广泛 用 来 帮助 程序 员 推 导 代 码 的 概念 ， 就 是 不 变量 〈invariants) 一 一 对 于 
特定 的 数据 结构 总 是 为 真 的 语句 ， 例 如 “此 变量 包含 了 列表 中 项 目的 数量 ”这 些 不 恋 
量 在 更 新 中 经 常 被 打破 ， 尤 其 是 在 数据 结构 比较 复杂 或 是 更 新 需要 修改 超过 一 个 值 时 。 

考虑 一 个 双向 链表 ， 它 的 每 一 个 节点 持 有 指向 表 中 下 一 节点 和 前 一 节点 的 指针 。 其 
中 一 个 不 变量 就 是 如 果 你 跟随 从 一 个 节点 (A) 到 另 一 个 节点 (B) 的 “下 一 个 ”指针 ， 
则 那个 节点 (B) 的 “前 一 个 ”指针 指 回 到 前 一 个 节点 (A)。 为 了 从 表 中 删除 一 个 节点 ， 
两 边 的 节点 都 必须 被 更 新 为 指向 彼此 。 一 旦 其 中 一 个 被 更 新 ， 直 到 另 一 侧 的 节点 也 被 更 
新 前 不 变量 是 打破 的 ， 当 更 新 完成 后 ， 再 次 持 有 不 变量 。 

从 这 样 的 表 中 删 去 一 个 条 目的 步骤 如 图 3.1 所 示 。 

1 标识 要 删除 的 节点 (N) 

2 EN 的 前 一 节点 到 N 的 链接 更 新 为 指向 N 的 后 一 节点 。 

3 将 N 的 后 一 节点 到 N 的 链接 更 新 为 指向 N 的 前 一 节点 。 

4 删除 节点 N。 

如 你 所 见 ， 在 步 又 b 和 之 间 ， 在 一 个 方向 上 的 链接 与 在 相反 的 方向 上 的 链接 不 一 
致 ， 并 且 不 变量 损坏 。 

修改 线程 之 间 共 享 数据 的 最 简单 的 潜在 问题 就 是 破坏 不 变量 。 如 果 你 没有 为 确保 其 
他 情况 而 做 些 特别 的 工作 ， 要 是 一 个 线程 正在 读 取 双 向 链表 ， 而 另 一 个 线程 正在 删除 一 
个 节点 ， 那 么 读 线程 很 有 可 能 看 到 一 个 节点 仅 被 部 分 删除 了 的 链表 (因为 在 图 3.1 的 步 
JR b 中 ， 只 有 其 中 一 个 链接 被 改变 了 ) ， 因 此 不 变量 损坏 。 不 变量 损坏 的 后 果 可 能 有 所 
不 同 ， 如 果 其 他 线程 只 是 在 图 中 由 左 到 右 读 取 链 表 项 ， 它 会 跳 过 正 被 删除 的 节点 。 另 一 
方面 ， 如 果 又 一 个 线程 试图 删除 图 中 最 右边 的 节点 ， 则 可 能 最 终 永久 性 破坏 数据 结构 ， 
并 使 得 程序 朋 溃 。 无 论 结果 如 何 ， 这 是 并 发 代码 中 错误 的 最 常见 诱因 之 一 的 例子 ; 竞争 
条 件 (race condition), 
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a) 


b) 


d) 


图 3.1 从 双向 链表 中 删除 一 个 节点 


竞争 条 件 


假设 你 在 电影 院 买 票 看 电影 。 如 果 是 个 大 电影 院 ， 会 有 多 个 收银 员 收 款 ， 所 以 不 止 
一 个 人 可 以 同时 买 票 。 如 果 有 人 在 另 一 个 收银 台 也 购买 了 与 你 同一 部 电影 的 票 ， 这 时 可 
供 你 选择 的 座位 取决 于 事实 上 是 其 他 人 先 订购 还 是 你 先 订购 。 如 果 只 剩 少量 座位 ， 这 种 
差异 可 能 会 很 关键 。 字 面 上 可 以 看 作 一 个 比赛 ,看 谁 得 到 最 后 的 电影 票 。 这 是 一 个 竞争 
条 件 (race condition) 的 例子 : 得 到 哪个 座位 (或 者 甚至 是 否 得 到 票 ) 取决 于 两 次 购买 
的 相对 顺序 。 
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在 并 发 性 中 , 竞争 条 件 就 是 结果 取决 于 两 个 或 更 多 线程 上 的 操作 执行 的 相对 顺序 的 
一 切 事物 。 线 程 竞 争执 行 各 自 的 操作 。 在 大 多 数 情况 下 ， 这 是 比较 良性 的 ， 因 为 所 有 可 
能 的 结果 都 是 可 以 接受 的 ， 尽 管 他 们 可 能 会 随 着 不 同 的 相对 顺序 而 改变 。 例 如 ， 如 果 两 
个 线程 都 将 项 目 添加 到 一 个 队列 中 等 待 处 理 ， 在 保持 系统 不 变量 的 前 提 下 ， 哪 个 项 目 先 
被 添加 一 般 是 不 影响 的 。 当 竞争 条 件 导致 损坏 不 变量 时 才 会 出 现 问题 ， 以 刚才 提 到 的 双 
向 链表 为 例 。 在 谈 到 并 发 时 ， 术 语 竞争 条 件 (race condition) 通常 用 来 表示 有 问题 的 
(problematic) 竞争 条 件 。 良 性 的 竞争 条 件 没 什么 意思 ， 也 不 是 错误 的 诱因 。C++ 标 准 
还 定义 了 术语 数据 竞争 (data race)， 表 示 因 对 单个 对 象 的 并 发 修改 而 产生 的 特定 类 型 
的 竞争 条 件 (参见 5.1.2 节 ) ， 数 据 竞争 造成 可 怕 的 未 定义 行为 《undefined behavior), 

有 问题 的 竞争 条 件 通常 发 生 在 完成 操作 需要 修改 两 个 或 多 个 不 同 的 数据 块 的 地 方 ， 
就 如 示例 中 的 两 个 链表 指针 。 因 为 该 操作 必须 访问 两 块 独立 的 数据 ， 这 必须 在 单独 的 指 
令 中 进行 修改 ,而 当 只 有 其 中 一 条 指令 完成 时 ， 另 一 个 线程 有 可 能 访问 此 数据 结构 。 竞 
争 条 件 往往 很 难 找到 且 难 以 复制 ,因为 机 遇 的 窗口 很 小 。 如 果 这 些 修改 作为 连续 的 CPU 
指令 来 完成 ， 在 任意 一 次 运行 中 显现 问题 的 机 会 是 非常 小 的 ， 即 使 数据 结构 正 被 另 一 个 
线程 并 发 访问 。 随 着 系统 上 负载 的 升 高 ， 以 及 执行 该 操作 次 数 的 增加 ， 有 问题 的 执行 序 
列 出 现 的 机 会 也 增加 。 这 种 问题 几乎 是 不 可 避免 地 会 在 最 不 方便 的 时 间 暴 露出 来 。 由 于 
竞争 条 件 一 般 是 时 间 敏 感 的 ， 它 们 常常 在 应 用 程序 运行 于 调试 工具 下 时 完全 消失 ， 因 为 
调试 工具 会 影响 程序 的 时 间 ， 即 使 只 是 轻微 地 。 

如 果 你 正在 编写 多 线程 程序 ， 竞争 条 件 会 轻易 地 成 为 你 生活 的 灾难 。 编 写 使 用 并 发 
的 软件 中 大 量 的 复杂 性 来 源 于 避免 有 问题 的 竞争 条 件 。 


3.1.2 ”避免 有 问题 的 竞争 条 件 


有 几 种 方法 来 处 理 有 问题 的 竞争 条 件 。 最 简单 的 选择 是 用 保护 机 制 封装 你 的 数据 结 
构 ， 以 确保 只 有 实际 执行 修改 的 线程 能 够 在 不 变量 损坏 的 地 方 看 到 中 间 数 据 。 从 其 他 访 
问 该 数据 结构 线程 的 角度 看 ,这 种 修改 要 么 还 没 开 始 要 么 已 完成 。C ++ 标 准 库 提供 了 一 
些 这 样 的 机 制 ， 在 本 章 中 均 有 述 及 。 

另 一 个 选择 是 修改 数据 结构 的 设计 及 其 不 变量 ,从 而 令 修改 作为 一 系列 不 可 分 割 的 
变更 来 完成 ， 每 个 修改 均 保留 其 不 变量 。 这 通常 被 称 为 无 锁 编程 〈lock-free 
programming)， 且 难以 尽善尽美 。 如 果 你 工作 在 这 个 级 别 上 ， 内 存 模型 的 细微 差异 和 
确认 哪些 线程 可 能 看 到 哪 组 值 ， 会 变 得 很 复杂 。 内 存 模 型 在 第 5 章 中 阐述 ,而 无 锁 编程 
在 第 7 章 中 进行 讨论 。 

处 理 竞 争 条 件 的 另 一 种 方式 是 将 对 数据 结构 的 更 新 作为 一 个 事务 (transaction ) 来 
处 理 ， 就 如 同 在 一 个 事务 内 完成 数据 库 的 更 新 一 样 。 所 需 的 一 系列 数据 修改 和 读 取 被 存 
储 在 一 个 事务 日 志 中 ， 然 后 在 单个 步 又 中 进行 提交 。 如 果 该 提交 因为 数据 结构 已 被 另 一 
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个 线程 修改 而 无 法 进行 ， 该 事务 将 重新 启动 。 这 称 为 软件 事务 内 存 (software 
transactional memory, STM), 在 写作 时 这 是 一 个 活跃 的 研究 领域 。 这 在 本 书 中 不 会 述 
及 ， 因 为 在 CH+ 中 没有 对 STM 的 直接 支持 。 然 而 ， 私 下 里 做 些 事情 然后 在 单个 步骤 中 
提交 的 基本 思想 ， 我 会 在 后 面 提 到 。 

由 C++ 标准 提供 的 保护 共享 数据 的 最 基本 机 制 是 互 斥 元 mutex), 那么 我 们 先 来 看 
一 看 。 


用 互 斥 元 保护 共享 数据 


于 是 , 你 有 一 个 类 似 于 上 一 节 中 链表 那样 的 共享 数据 结构 ， 你 想 要 保护 它 免 于 竞争 
条 件 以 及 可 能 因此 产生 的 不 变量 损坏 。 如 果 你 可 以 将 所 有 访问 该 数据 结构 的 代码 块 标记 
HERY (mutually exclusive)， 岂 不 是 很 好 ? 如 果 任 何 线程 运行 了 其 中 之 一 ， 所 有 其 
他 试图 访问 此 数据 结构 的 线程 就 必须 一 直 等 到 第 一 个 线程 完成 。 这 就 使 得 线程 不 可 能 看 
到 损坏 的 不 变量 ， 除 非 它 是 进行 修改 的 线程 。 

咽 ， 这 并 非 无稽 之 谈 一 一 它 正 是 使 用 称 为 互 斥 元 mutex, mutual exclusion) 的 同 
步 原 语 所 能 得 到 的 。 在 访问 共享 数据 结构 之 前 ， 锁 定 〈lock) 与 该 数据 相关 的 互 斥 元 ， 
当 访问 数据 结构 完成 后 ， 解 锁 unlock) 该 互 斥 元 。 线 程 库 会 确保 一 旦 一 个 线程 已 经 锁 
定 某 个 互 斥 元 ， 所 有 其 他 试图 锁定 相同 互 斥 元 的 线程 必须 等 待 ， 直 到 成 功 锁定 了 该 互 斥 
元 的 线程 解锁 此 互 斥 元 。 这 就 确保 所 有 线程 看 到 共享 数据 自 洽 的 一 面 ， 不 带 有 任何 损坏 
的 不 变量 。 

互 斥 元 是 C++ 中 最 常见 的 数据 保护 机 制 ， 但 并 非 灵丹妙药 。 精 心 组 织 代码 来 保护 正 
确 的 数据 (参见 3.2.2 节 ) 以 及 避免 接口 中 国有 的 竞争 条 件 (参见 3.2.3 节 ) 也 是 很 重要 
的 。 互 斥 元 也 伴随 着 自己 的 问题 ， 以 死 锁 (deadlock)〉 (参见 3.2.4 节 ) 和 保护 过 多 或 过 
少数 据 (参见 3.2.8 节 ) 的 形式 。 接 下 来 ， 让 我 们 从 基础 开始 。 


使 用 C++ 中 的 互 斥 元 


在 C++ 中 , 通过 构造 std: :mutex 的 实例 创建 互 斥 元 ， 调 用 成 员 函 数 Lock () 来 
锁定 它 ， 调 用 成 员 函 数 unlock () 来 解锁 它 。 然 而 ， 直 接 调用 成 员 函 数 是 不 推荐 的 做 
法 ， 因 为 这 意味 着 你 必须 记 住 在 离开 函数 的 每 条 代码 路 径 上 都 调用 unlock () ， 包 括 
由 于 异常 所 导致 的 在 内 。 作 为 替代 ， 标 准 C ++ 库 提供 了 std::lock guard 类 模板 ， 
实现 了 互 斥 元 的 RAII 惯用 语法 ; 它 在 构造 时 锁定 所 给 的 互 斥 元 , 在 析 构 时 将 互 斥 元 解 
锁 ， 从 而 保证 被 锁定 的 互 斥 元 始终 被 正确 解锁 。 清 单 3.1 的 代码 展示 了 如 何 使 用 
std: :mutex 保护 一 个 可 被 多 个 线程 访问 的 列表 ,连同 std: :lock_guard, 二 者 都 
声明 于 <mutex> 头 文件 中 。 
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清单 3.1 用 互 斥 元 保护 列表 


#include <list> 
#include <mutex> 
#include <algorithm> 


std::list<int> some list; +@ 
std: :mutex some_mutex; +O 


void add to list(int new value) 
Std::lock guard«std::mutex» guard(some mutex); -© 


Some list.push back (new value); 


) 


bool list contains(int value to find) 


Sad 
std: :lock_guard<std::mutex> guard (some_mutex) ; 
return std::find(some list.begin(),some list.end(),value to find) 
!= some list.end(); 


在 清单 3.1 中 ， 有 一 个 全 局 变量 @， 它 被 相应 的 std: :mutex 的 全 局 实例 @ 保 护 。 在 
add to list ()@ 以 及 list contains()@ 中 对 std::lock guard«std: :mutex> 的 
使 用 意味 着 这 些 函数 中 的 访问 是 互 斥 的 ，1ist_contains() 将 无 法 在 add to list () 进 
行 修改 的 半途 中 看 到 该 列表 。 

尽管 这 种 全 局 变量 的 使 用 偶尔 也 是 恰当 的 ， 在 大 多 数 情况 下 ， 不 用 全 局 变量 ， 而 是 
在 类 中 将 互 斥 元 和 受 保护 的 数据 组 织 在 一 起 ， 是 很 普遍 的 。 这 是 一 个 标准 的 面向 对 象 应 
用 程序 设计 规则 ， 通 过 将 它们 放 在 一 个 类 中 ， 清 楚 地 标记 他 们 是 相关 的 ， 还 可 以 封装 函 
数 以 及 强制 保护 。 在 这 种 情况 下 ,函数 add_to_ list 和 list contains 将 成 为 类 的 
成 员 函 数 ， 互 斥 元 和 受 保护 的 数据 都 作为 类 的 private 成 员 ， 使 其 更 容易 鉴别 哪些 代 
码 可 以 访问 数据 ， 哪 些 代码 需要 锁定 互 斥 元 。 如 果 类 的 所 有 成 员 函 数 在 访问 任意 其 他 数 
据 成 员 之 前 锁定 互 斥 元 ， 并 且 在 操作 完成 时 解锁 ， 则 数据 对 于 所 有 的 访问 者 都 被 很 好 地 
保护 了 。 
其 实 ， 并 不 完全 是 那样 ， 你 将 敏锐 地 发 现 ， 如 果 其 中 一 个 成 员 函 数 返 回 对 受 保 护 数 
据 的 指针 或 引用 ， 那么 所 有 成 员 函 数 都 以 良好 顺序 的 方式 锁定 互 斥 元 也 是 没关系 的 ， 因 
为 你 已 在 保护 中 捅 了 一 个 大 窒 隆 。 能 够 访问 (并 可 能 修改 ) 该 指针 或 引用 的 任意 代码 现 
在 可 以 访问 受 保护 的 数据 而 无 需 锁定 该 互 斥 元 。 因 此 使 用 互 斥 元 保护 数据 需要 仔细 设计 
接口 ， 以 确保 在 有 任意 对 受 保护 的 数据 进行 访问 之 前 ， 互 斥 元 已 被 锁定 ， 且 不 留 后 门 。 


3.2.2 为 保护 共享 数据 精心 组 织 代码 


如 你 所 见 , 用 互 斥 元 保护 数据 并 不 只 是 像 在 每 个 成 员 函 数 中 拍 进 一 个 std: :lock 
guard 对 象 那样 容易 ， 一 个 迷路 的 指针 或 引用 ， 所 有 的 保护 都 将 白费 。 在 一 个 层面 上 ， 
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检查 迷路 的 指针 或 引用 是 容易 的 ， 只 要 没有 一 个 成 员 函 数 通过 其 返回 值 或 输出 参数 ， 返 
回 受 保护 数据 的 指针 或 引用 给 其 调用 者 ， 数 据 就 安全 了 。 如 果 更 深入 一 些 ， 它 没有 那么 
直观 一 一 远 远 没有 。 除 了 检查 成 员 函 数 没 有 向 其 调用 者 传 出 指针 和 引用 ， 检 查 它们 没 
有 向 其 调用 的 不 在 你 掌控 之 下 的 函数 传人 这 种 指针 和 引用 ， 也 是 很 重要 的 。 这 同样 危 
险 ， 那 些 函数 可 能 将 指针 和 引用 存储 在 某 个 地 方 ， 将 来 可 以 脱离 互 斥 元 的 保护 而 被 使 
用 。 在 这 方面 特别 危险 的 是 ， 函 数 是 通过 函数 参数 或 其 他 方式 在 运行 时 提供 的 ， 如 清 
单 3.2 所 示 。 


意外 地 传 出 对 受 保护 数据 的 引用 


class some data 
{ 

int a; 

std::string b; 
public: 

void do something(); 
Yr 


class data_wrapper 
( 
private: 
some data data; 
std: :mutex m; 
public: 
template<typename Function> 
void process data(Function func) 


{ 
std::lock guard«std::mutex» l(m); 传递 “ 受 保护 的 ”数据 到 
func (data) ; 用 户 提供 的 函数 
} 
Ja 
some_data* unprotected; 


void malicious function(some data& protected data) 


{ 
} 


data wrapper x; 


void foo() 传人 一 个 恶意 

人 函数 对 受 保护 的 数据 
x.process data(malicious function); 进行 未 受 保 护 的 
unprotected->do_something() ; 访问 


unprotected-&protected data; 


) 

在 这 个 例子 中 ,process_data 中 的 代码 看 起 来 挺 无 害 ， 受 到 std: :lock_guard 
很 好 地 保护 ， 但 对 用 户 提供 的 函数 func 的 调用 @ 意 味 着 foo 可 以 传人 malicious. 
function@ 来 绕 过 保护 ， 然 后 无 需 锁 定 互 斥 元 即 可 调用 do_something() ©, 
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从 根本 上 说 ,这 个 代码 的 问题 在 于 它 没有 完成 你 所 设置 的 内 容 ,标记 所 有 访问 该 数 
据 结构 的 代码 为 互 斥 的 《mutually exelusive)。 在 这 个 例子 中 ， 忽 略 了 foo () 中 调用 
unprotected-»do something () 的 代码 。 不 幸 的 是 ,这 部 分 问题 不 是 C++ 线程 库 所 
能 帮助 你 的 ， 而 这 取决 于 作为 程序 员 的 你 ， 去 锁定 正确 的 互 斥 元 来 保护 你 的 数据 。 想 想 
好 的 一 面 ， 你 有 了 一 个 可 遵循 的 准则 ， 它 会 在 这 些 情况 下 帮助 你 : 不 要 将 对 受 保护 数据 
的 指针 和 引用 传递 到 锁 的 范围 之 外 ， 无 论 是 通过 从 函数 中 返回 它们 、 将 其 存放 在 外 部 可 
见 的 内 存 中 ， 还 是 作为 参数 传递 给 用 户 提供 的 函数 。 

虽然 这 是 在 试图 使 用 互 斥 元 来 保护 共享 数据 时 常 犯 的 错误 ， 但 这 绝 非 唯一 可 能 的 隐 
患 。 在 下 一 节 中 你 会 看 到 ， 可 能 仍然 会 有 竞争 条 件 ， 即 便当 数据 被 互 斥 元 保护 着 。 


3.2.3 发现 接口 中 固有 的 竞争 条 件 


仅仅 因为 使 用 了 互 斥 元 或 其 他 机 制 来 保护 共享 数据 ， 未 必 会 免 于 竞争 条 件 ， 你 仍然 
需要 确定 保护 了 适当 的 数据 。 再 次 考虑 双向 链表 的 例子 。 为 了 让 线程 安全 地 删除 节点 ， 
你 需要 确保 已 阻止 对 三 个 结 点 的 并 发 访问 。 要 删除 的 节点 及 其 两 边 的 结 点 。 如 果 你 分 
别 保 护 访问 每 个 节点 的 指针 ， 就 不 会 比 未 使 用 互 斥 元 的 代码 更 好 ， 因 为 竞争 条 件 仍 会 
发 生 一 一 需要 保护 的 不 是 个 别 步 又 中 的 个 别 结 点 ， 而 是 整个 删除 操作 中 的 整个 数据 结 
构 。 这 种 情况 下 最 简单 的 解决 办 法 ， 就 是 用 单个 互 斥 元 保护 整个 列表 ， 如 清单 3.1 中 所 示 。 

仅仅 因为 在 列表 上 的 个 别 操作 是 安全 的 ， 你 还 没有 摆脱 困境 。 你 仍然 会 遇 到 竞争 条 
件 ， 即 便 是 一 个 非常 简单 的 接口 。 考 虑 像 sta: : stack 容器 适配器 这 样 的 堆栈 数据 结 
构 ， 如 清单 3.3 中 所 示 。 除 了 构造 函数 和 swap O ,对 std: : stack 你 只 有 五 件 事情 可 
以 做 : 可 以 push () 一 个 新 元 素 人 栈 、pPop () 一 个 元 素 出 栈 、 读 top () 元 素 、 检 查 它 是 
F empty () 以 及 读 取 元 素数 量 一 一 堆栈 的 size () 。 如 果 更 改 top () 使 得 它 返回 一 个 
副本 ， 而 不 是 引用 (这样 你 就 遵循 了 3.2.2 节 的 准则 )， 同 时 用 互 斥 元 保护 内 部 数据 ， 该 
接口 依然 固有 地 受制 于 竞争 条 件 。 这 个 问题 对 基于 互 斥 元 的 实现 并 不 是 独一无二 的 。 它 
是 一 个 接口 问题 ， 因 此 对 于 无 锁 实 现 仍然 会 发 生 竞争 条 件 。 


清单 3.3  std:stack 容器 适配器 的 接口 
template<typename T,typename Container=std::deque<T> > 

class stack 

{ 

public: 

explicit stack(const Container&); 

explicit stack(Container&& - Container()); 

template «class Alloc» explicit stack(const Alloc&); 

template «class Alloc» stack(const Container&, const Alloc&); 
template «class Alloc» stack(Container&&, const Alloc&); 
template «class Alloc» stack(stack&&, const Alloc&); 
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bool empty() const; 
Size t size() const; 
T& top(); 

T const& top() const; 
void push(T const&); 
void push (T&&) ; 

void pop(); 

void swap (stack&&) ; 


这 里 的 问题 是 empty O 的 结果 和 size () 不 可 靠 。 虽 然 它 们 可 能 在 被 调用 时 是 正确 
的 , 一 旦 它们 返回 , 在 调用 了 empty O 或 size O 的 线程 可 以 使 用 该 信息 之 前 ， 其 他 线 
程 可 以 自由 地 访问 堆栈 ， 并 且 可 能 push O 新 元 素 人 栈 或 Pop O 已 有 的 元 素 出 栈 。 
”特别 地 , 如 果 该 stack 实例 是 非 共享 的 , 如 果 栈 非 空 , 检查 empty O MH top O 
访问 顶部 元 素 是 安全 的 ， 如 下 所 示 。 


Stack«int» s; 


if(!s.empty()) «9o 

{ 
int const value=s.top(); +@ 
s.pop(); -© 


do something (value); 


} 

它 不 仅 在 单线 程 代码 中 是 安全 的 ， 预 计 为 ， 在 空 堆栈 上 调用 top O 是 未 定义 的 行为 。 
对 于 共享 的 stack 对 象 , 这 个 调用 序列 不 再 安全 , 因为 在 调用 empty () @ 和 调用 cop 0 @ 
之 间 可 能 有 来 自 另 一 个 线程 的 pop () 调用 ， 删 除 最 后 一 个 元 素 。 因 此 ， 这 是 一 个 典型 的 竞 
争 条 件 ， 为 了 保护 栈 的 内 容 而 在 内 部 使 用 互 斥 元 ， 却 并 未 能 将 其 阻止， 这 就 是 接口 的 影响 。 

怎 和 解决 呢 ? 发 生 这 个 问题 是 接口 设计 的 后 果 , 所 以 解决 办 法 就 是 改变 接口 。 然 而 ， 
这 仍然 回避 了 问题 ,要 作出 什么 样 的 改变 ? 在 最 简单 的 情况 下 , 你 只 要 声明 top () 在 调 
用 时 如 果 栈 中 没有 元 素 则 引发 异常 。 虽 然 这 直接 解决 了 问题 ， 但 它 使 编程 变 得 更 麻烦 ， 
因为 现在 你 得 能 捕捉 异常 ,即使 对 empty O 的 调用 返回 false。 这 基本 上 使 得 empty() 
的 调用 变 得 纯粹 多 余 。 

如 果 你 仔细 看 看 前 面 的 代码 片段 ， 还 有 另 一 个 可 能 的 竞争 条 件 ， 但 这 一 次 是 在 调用 
top () @ 和 调用 pop () @ 之 间 。 考 虑 运行 着 前 面 代码 片段 的 两 个 线程 ， 它们 都 引用 着 
同一 个 stack 对 象 s。 这 并 非 罕 见 的 情形 ， 当 为 了 性 能 而 使 用 线程 时 ， 有 数 个 线程 在 
不 同 的 数据 上 运行 相同 的 代码 是 很 常见 的 ， 并 且 一 个 共享 的 stack 对 象 非常 适合 用 来 
在 它们 之 间 分 隔 工 作 。 假 设 一 开始 栈 里 有 两 个 元 素 ， 那么 你 不 用 担心 在 任 一 线程 上 的 
empty () Al top () 之 间 的 竞争 ， 只 需 考虑 可 能 的 执行 模式 。 

如 果 栈 从 内 部 被 互 斥 元 保护 ， 只 有 一 个 线程 可 以 在 任何 时 间 运 行 栈 的 成 员 函 数 ， 那 
么 这 些 调用 就 能 得 以 很 好 地 交错 ， 而 对 do something () 的 调用 可 以 同时 运行 。 n 
可 能 的 执行 正如 表 3.1 所 示 。 
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表 3.1 两 个 线程 堆栈 上 可 能 的 操作 顺序 


if(!s.empty()) 
if(!s.empty()) 
int const value = s.top(); 
int const value = s.top(); 
s.pop(); 


do something(value); s.pop(); 


do something(value); 

如 你 所 见 , 如 果 这 些 是 仅 有 的 在 运行 的 线程 , 在 两 次 调用 top O 修改 该 栈 之 间 没有 
任何 东西 ， 所 以 这 两 个 线程 将 看 到 相同 的 值 。 不 仅 如 此 ,在 pop O 的 两 次 调用 之 间 没 有 
对 top O 的 调用 。 因 此 , 栈 上 的 两 个 值 其 中 一 个 还 没 被 读 取 就 被 丢弃 了 ,而 另 一 个 被 处 
理 了 两 次 。 这 是 另 一 种 竞争 条 件 ， 远 比 empty() 人 op O 竞争 的 未 定义 行为 更 槽 糕 。 从 
来 没有 任何 明显 的 错误 发 生 ， 同 时 错误 造成 的 后 果 可 能 和 诱因 差距 其 远 ， 尽 管 他 们 明显 
取决 于 do_something () 到 底 做 什么 。 

这 要 求 对 接口 进行 更 加 激进 的 改变 ， 在 互 斥 元 的 保护 下 结合 对 top () 和 pop O 两 
者 的 调用 。Tom Cargill’ 指出 ， 如 果 栈 上 对 象 的 拷贝 构造 函数 能 够 引发 异常 ， 结 合 调用 可 
能 会 导致 问题 。 从 Herb Sutter 的 异常 安全 的 观点 来 看 ， 这 个 问题 被 处 理 得 较为 全 面 ,但 
潜在 的 竞争 条 件 为 这 一 结合 带 来 了 新 的 东西 。 

对 于 那些 尚未 意识 到 这 个 问题 的 人 ， 考 虑 一 下 stack<vector<int>>。 现 在 ， 
vector 是 一 个 动态 大 小 的 容器 ， 所 以 当 你 复制 vector 时 ， 为 了 复制 其 内 容 ， 库 就 必 
须 从 堆 中 分 配 更 多 的 内 存 。 如 果 系统 负载 过 重 ， 或 有 明显 的 资源 约束 ， 此 次 内 存 分 配 就 
可 能 失败 ， 于 是 vector 的 拷贝 构造 函数 可 能 引发 std::bad alloc 异常 。 如 果 
vector 中 含有 大 量 的 元 素 的 话 则 尤其 可 能 。 如 果 pop O 函数 被 定义 为 返回 出 栈 值 ， 并 
且 从 栈 中 删除 它 ， 就 会 有 潜在 的 问题 。 仅 在 栈 被 修改 后 ， 出 栈 值 才 返回 给 调用 者 ， 但 复 
制 数据 以 返回 给 调用 者 的 过 程 可 能 会 引发 异常 。 如 果 发 生 这 种 情况 ， 刚 从 栈 中 出 栈 的 数 
据 会 丢失 ， 它 已 经 从 栈 中 被 删除 了 ， 但 该 复制 却 没 成 功 ! std: :stack 接口 的 设计 者 第 
统 地 将 操作 一 分 为 二 。 获 取 顶 部 的 元 素 (top () ) ， 然 后 将 其 从 栈 中 删除 (pop () ) A 
致 于 你 无 法 安全 地 复制 数据 ， 它 将 留 在 栈 上 。 如 果 问 题 是 堆 内 存 不 足 ， 也 许 应 用 程序 可 
以 释放 一 些 内 存 ， 然 后 再 试 一 次 。 

不 幸 的 是 ， 这 种 划分 正 是 你 在 消除 竞争 条 件 中 试图 去 避免 的 ! 值得 庆幸 的 是 ， 还 有 
替代 方案 ， 但 他 们 并 非 无 代价 的 。 


! Tom Cargill, Exception Handling: A False Sense of Security, in C++ Report 6, no. 9 (November 
December 1994). Also available at http://www.informit.com/content/images/020163371x/ supplements/ 
Exception Handling Article.html 

? Herb Sutter, Exceptional C++: 47 Engineering Puzzles, Programming Problems, and Solutions (Addison 
Wesley Professional, 1999) 
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1. 选项 1: 传 入 引用 


第 一 个 选项 是 把 你 希望 接受 出 栈 值 的 变量 的 引用 ， 作 为 参数 传递 给 对 pop O 的 调用 。 


Std::vector«int» result; 
some stack.pop (result); 


这 在 很 多 情况 下 都 适用 ， 但 它 有 个 明显 的 缺点 ， 要 求 调用 代码 在 调用 之 前 先 构造 一 
个 该 栈 值 类 型 的 实例 ， 以 便 将 其 作为 目标 传人 。 对 于 某 些 类 型 而 言 这 是 行 不 通 的 ， 因 为 
构造 一 个 实例 在 时 间 和 资源 方面 是 非常 昂贵 的 。 对 于 其 他 类 型 ， 这 并 不 总 是 可 能 的 ， 因 
为 构造 函数 需要 参数 ， 而 在 代码 的 这 个 位 置 不 一 定 可 用 。 最 后 ， 它 要 求 所 存储 的 类 型 是 
可 赋值 的 。 这 是 一 个 重要 的 限制 。 许 多 用 户 定义 的 类 型 不 支持 赋值 ， 尽 管 它们 可 能 支持 
移动 构造 函数 ， 或 者 甚至 是 拷贝 构造 函数 〈 从 而 允许 通过 值 来 返回 ) 。 


2. 选项 2， 要求 不 引发 异常 的 找 贝 构造 函数 或 移动 构造 函数 


对 于 有 返回 值 的 5op O 而 言 只 有 一 个 异常 安全 问题 , 就 是 以 值 进行 的 返回 可 能 引发 
异常 。 许 多 类 型 具有 不 引发 异常 的 拷贝 构造 函数 ， 并且 在 C++ 标准 中 有 了 新 的 右 值 引用 
的 支持 (参见 附录 A 中 A.1 节 )， 越 来 越 多 的 类 型 将 不 会 引发 异常 的 移动 构造 函数 ， 即 
便 他 们 的 拷贝 构造 函数 会 如 此 。 一 个 有 效 的 选择 ， 就 是 把 对 线程 安全 堆栈 的 使 用 ， 限 制 
在 能 够 安全 地 通过 值 来 返回 且 不 引发 异常 的 类 型 之 内 。 

虽然 这 样 安全 了 ， 但 并 不 理想 。 尽 管 你 可 以 在 编译 时 使 用 std::is nothrow. 
copy constructible 和 std: :is nothrow move constructible 类 型 特 
征 ， 来 检测 一 个 不 引发 异常 的 拷贝 或 移动 构造 函数 的 存在 ， 但 这 却 很 受 限制 。 相 比 
于 具有 不 能 引发 异常 的 拷贝 和 /或 移动 构造 函数 的 类 型 ， 有 更 多 的 用 户 定义 类 型 具有 
能 够 引发 异常 的 拷贝 构造 函数 且 没 有 移动 构造 函数 (尽管 这 会 随 着 人 们 习惯 了 C 
++11 中 对 右 值 引用 的 支持 而 改变 )。 如 果 这 种 类 型 不 能 被 存储 在 你 的 线程 安全 堆栈 
中 ， 是 不 幸 的 。 


3. 选项 3; 返回 指向 出 栈 项 的 指针 


第 三 个 选择 是 返回 一 个 指向 出 栈 项 的 指针 ， 而 非 通过 值 来 返回 该 项 。 其 优点 是 指针 
可 以 被 自由 地 复制 而 不 会 引发 异常 ， 这 样 你 就 避免 了 Cargill 的 异常 问题 。 其 缺点 是 , 返 
回 一 个 指针 时 需要 一 种 手段 来 管理 分 配给 对 象 的 内 存 ， 对 于 像 整数 这 样 简单 的 类 型 ， 这 
种 内 存 管理 的 成 本 可 能 会 超过 仅 通 过 值 来 返回 该 类 型 。 对 于 任何 使 用 此 选项 的 接口 ， 
std: :shared_ptr 会 是 指针 类 型 的 一 个 好 的 选择 。 它 不 仅 避 免 了 内 存 泄漏 ， 因 为 一 旦 
最 后 一 个 指针 被 销毁 则 该 对 象 也 会 被 销毁 ， 并且 库 可 以 完全 控制 内 存 分 配方 案 且 不 必 使 
用 new 和 delete。 对 于 优化 用 途 来 说 这 是 很 重要 的 ， 要 求 用 new 分 别 分 配 堆栈 中 的 
每 一 个 对 象 ， 会 比 原来 非 线程 安全 的 版 本 带 来 大 得 多 的 开销 。 
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4. 选项 4; 同时 提供 选项 1 以 及 2 或 3 


灵活 性 永远 不 应 被 排除 在 外 ， 特 别 是 在 通用 的 代码 中 。 如 果 你 选择 选项 2 或 3， 那 
么 同时 提供 选项 1 也 是 相对 容易 的 ,这 也 为 你 的 代码 的 用 户 提供 了 选择 的 能 力 , 为 了 很 
小 的 额外 成 本 ， 哪 个 选项 对 他 们 是 最 适合 的 。 


5. 一 个 线程 安全 堆栈 的 示范 定义 


清单 3.4 展示 了 在 接口 中 没有 竞争 条 件 的 栈 的 类 定义 ， 实 现 了 选项 1 和 3。pop () 
有 两 个 重 载 ， 一 个 接受 存储 该 值 的 位 置 的 引用 ， 另 一 个 返回 std:: shared ptr<>, 
它 具 有 一 个 简单 的 接口 ， 只 有 两 个 函数 ，push O fll pop(), 


清单 3.4 ”一 个 线程 安全 栈 的 概要 类 定义 


#include «exception» 
#include <memory> 


<7) For std::shared_ptr<> 
struct empty stack: std::exception 


const char* what() const throw(); 
}; 


template<typename T> 


class threadsafe stack 赋值 运算 符 被 删除 了 
{ 
public: 

threadsafe stack(); 

threadsafe stack(const threadsafe stack&); 

threadsafe stack& operator-(const threadsafe stack&) - delete; 


void push(T new value); 
Std::shared ptr«T» pop(); 
void pop(T& value); 

bool empty() const; 


通过 削减 接口 ， 你 考虑 到 了 最 大 的 安全 性 ， 甚 至 对 整个 堆栈 的 操作 都 受到 限制 。 栈 
本 身 不 能 被 赋值 ， 因 为 赋值 运算 符 被 删除 @ (参见 附录 A 中 A.2 节 )， 而 且 也 没有 
swap () 函数 。 然 而, 它 可 以 被 复制 ,假设 栈 的 元 素 可 以 被 复制 。 如 果 栈 是 空 的 , pop () 
函数 引发 一 个 empty_stack 异常 ， 所 以 即使 在 调用 empty O 后 栈 被 修改 ， 一 切 仍 将 
正常 工作 。 正 如 选项 3 的 描述 中 提 到 的 ， 如 果 需 要 ，std: :shared ptr 的 使 用 允许 栈 
来 处 理 内 存 分 配 问题 ， 同 时 避免 对 new 和 delete 的 过 多 调用 。 五 个 堆栈 操作 现在 变 
成 三 个 ， push () 、pop () 和 empty(), HA empty O 都 是 多 余 的 。 接 口 的 简化 可 以 
更 好 地 控制 数据 。 你 可 以 确保 互 斥 元 为 了 操作 的 整体 而 被 锁定 。 清 单 3.5 展现 了 一 个 简 
单 的 实现 ， 一 个 围绕 std: : stack<> 的 封装 器 。 
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清单 3.5 ”一 个 线程 安全 栈 的 详细 类 定义 


#include «exception» 
#include «memory» 
#include <mutex> 
#include «stack» 


struct empty_stack: std: :exception 


{ 
E 


template<typename T» 
class threadsafe stack 
{ 
private: 
std::stack<T> data; 
mutable std::mutex m; 
public: 
threadsafe_stack() {} 
threadsafe_stack (const threadsafe_stack& other) 


{ 


const char* what() const throw(); 


Std::lock guard«std::mutex» lock (other.m) ; 在 构造 函数 体 中 
data=other.data; 执行 复制 


) 


threadsafe stack& operator- (const threadsafe stack&) - delete; 


void push(T new value) 


std::lock guard«std::mutex» lock (m); 
data.push(new value); 


std::shared ptr«T» pop() r 
í 在 试 着 出 栈 值 的 时 候 检 
Bb 
std::lock_guard<std: :mutex> lock (m) ; 查 是 否 为 空 
if(data.empty()) throw empty stack(); 
std::shared ptr«T» const res(std::make shared«T» (data.top())); 


data.pop(); 
return res; 
) 在 修改 栈 之 前 
void pop(T& value) 分 配 返 回 值 
{ 
std::lock_guard<std: :mutex> lock (m); 
if(data.empty()) throw empty stack); 
valuesdata.top(); 
data.pop(); 
} 


bool empty() const 


{ 
std: :lock_guard<std: :mutex> lock (m) ; 
return data.empty () ; 


} 


这 个 栈 的 实现 实际 上 是 可 复制 的 《ecopyable) 一 一 源 对 象 中 的 拷贝 构造 函数 锁定 互 
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斥 元 ， 然 后 复制 内 部 栈 。 你 在 构造 函数 体 中 进行 复制 @ 而 不 是 成 员 初始 化 列表 ， 以 确保 
互 斥 元 被 整个 副本 持 有 。 

top O fll pop O 的 讨论 表明 ,接口 中 有 问题 的 竞争 条 件 基本 上 因为 锁定 的 粒度 过 小 
而 引起 。 保护 没有 覆盖 期 望 操 作 的 整体 ,。 互 斥 元 的 问题 也 可 以 由 锁定 的 粒度 过 大 而 引起 ， 
极端 情况 是 单个 的 全 局 互 斥 元 保护 所 有 共享 的 数据 。 在 一 个 有 大 量 共享 数据 的 系统 中 ， 
这 可 能 会 消除 并 发 的 所 有 性 能 优势 ， 因 为 线程 被 限制 为 每 次 只 能 运行 一 个 ， 即 便 是 在 他 
们 访问 数据 的 不 同 部 分 的 时 候 。 被 设计 为 处 理 多 处 理 器 系统 的 Linux 内 核 的 第 一 个 版 本 ， 
使 用 了 单个 全 局 内 核 锁 。 虽 然 这 也 能 工作 ， 但 却 意 味 着 一 个 双 处 理 器 系统 通常 比 两 个 单 
处 理 器 系统 的 性 能 更 差 ， 四 个 处 理 器 系统 的 性 能 远 远 没有 四 个 单 处 理 器 系统 的 性 能 好 。 
有 太 多 对 内 核 的 竞争 ， 因 此 在 更 多 处 理 器 上 运行 的 线程 无 法 进行 有 效 的 工作 。Linux 内 
核 的 后 续 版 本 已 经 转移 到 一 个 更 细 粒 度 的 锁定 方案 ,因而 四 个 处 理 器 的 系统 性 能 更 接近 
理想 的 单 处 理 器 系统 的 4 倍 ， 因 为 竞争 少 得 多 。 

细 粒 度 锁 定 方案 的 一 个 问题 ， 就 是 有 时 为 了 保护 操作 中 的 所 有 数据 ， 需 要 不 止 一 个 
互 太 元 。 如 前 所 述 ， 有 时 要 做 的 正确 的 事情 是 增加 被 互 斥 元 所 覆盖 的 数据 粒度 ， 以 使 得 
只 需要 一 个 互 斥 元 被 锁定 。 然 而 ， 这 有 时 是 不 可 取 的 ， 例 如 互 斥 元 保护 着 一 个 类 的 各 个 
实例 。 在 这 种 情况 下 ， 在 下 个 级 别 进 行 锁定 ， 将 意味 着 要 么 将 锁 丢 给 用 户 ， 要 么 就 让 单 
个 互 斥 元 保护 该 类 的 所 有 实例 ， 这 些 都 不 甚 理想 。 

如 果 对 于 一 个 给 定 的 操作 你 最 终 需 要 锁定 两 个 或 更 多 的 互 斥 元 ,， 还 有 另 一 个 潜在 的 
问题 潜伏 在 侧 : 死 锁 (deadlock)。 这 几乎 是 竞争 条 件 的 反面 ， 两 个 线程 不 是 在 竞争 成 
为 第 一 ， 而 是 每 一 个 都 在 等 待 男 外 一 个 ， 因 而 都 不 会 有 任何 进展 。 


3.2.4 WH: 问题 和 解决 方案 


试想 一 下 ， 你 有 一 个 由 两 部 分 组 成 的 玩具 ， 并 且 你 需要 两 个 部 分 一 起 玩 一 一 例如 ， 
玩具 鼓 和 鼓 接 。 现 在 ， 假 设 你 有 两 个 小 孩 ， 他 们 两 人 都 喜欢 玩 它 。 如 果 其 中 一 人 同时 得 
到 鼓 和 鼓 析 ， 那 这 个 孩子 就 可 以 高 兴 地 玩 鼓 ， 直 到 厌烦 。 如 果 另 一 个 孩子 想 要 玩 ， 就 得 
等 ， 不 管 这 让 他 多 不 爽 。 现 在 想象 一 下 ， 鼓 和 鼓 梭 被 (分别) 埋 在 玩具 箱 里 ， 你 的 孩子 
同时 都 决定 玩 它们 ， 于 是 他 们 去 翻 玩 具 箱 。 其 中 一 个 发 现 了 鼓 ， 而 另 一 个 发 现 了 鼓 权 。 
现在 他 们 被 困 住 了 ， 除 非 一 人 让 另 一 人 玩 ， 不然 每 个 人 都 会 赖 着 他 已 有 的 东西 ， 并 要 求 
男 一 人 将 男 一 部 分 给 自己 ， 否 则 就 都 玩 不 成 。 

现在 想象 一 下 ， 你 没有 抢 玩具 的 孩子 ， 但 却 有 争夺 互 斥 元 的 线程 。 一 对 线程 中 的 每 
一 个 都 需要 同时 锁定 两 个 互 斥 元 来 执行 一 些 操作 ， 并 且 每 个 线程 都 拥有 了 一 个 互 斥 元 ， 
同时 等 待 另 外 一 个 。 线 程 都 无 法 继续 ， 因 为 每 个 线程 都 在 等 待 另 一 个 释放 其 互 斥 元 。 这 
种 情景 称 为 死 锁 〈deadlock)， 它 是 在 需要 锁定 两 个 或 更 多 互 斥 元 以 执行 操作 时 的 最 大 
问题 。 
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为 了 避免 死 锁 ， 常 见 的 建议 是 始终 使 用 相同 的 顺序 锁定 这 两 个 互 斥 元 。 如 果 你 总 是 
在 互 斥 元 B 之 前 锁定 互 斥 元 A， 那 么 你 永远 不 会 死 锁 。 有 时 候 这 是 很 直观 的 ， 因 为 互 斥 
元 服务 于 不 同 的 目的 ， 但 其 他 时 候 却 并 不 那么 简单 ， 比如 当 互 斥 元 分 别 保护 相同 类 的 各 
个 实例 时 。 例 如 ， 考 虑 同一 个 类 的 两 个 实例 之 间 的 数据 交换 操作 ， 为 了 确保 数据 被 正确 
地 交换 ， 而 不 受 并 发 修改 的 影响 ， 两 个 实例 上 的 互 斥 元 都 必须 被 锁定 。 然 而 ， 如 果 选 择 
了 一 个 固定 的 顺序 〈 例 如 ， 作 为 第 一 个 参数 提供 的 实例 的 互 斥 元 ， 然 后 是 作为 第 二 个 参 
数 所 提供 的 实力 的 互 斥 元 )， 可 能 适得其反 ， 它 表示 两 个 线程 尝试 通过 交换 参数 ， 而 在 
相同 的 两 个 实例 之 间 交 换 数 据 ， 你 将 产生 死 锁 。 

幸运 的 是 ，C++ 标 准 库 中 的 std::lock 可 以 解决 这 一 问题 std: :lock 函数 
可 以 同时 锁定 两 个 或 更 多 的 互 斥 元 ， 而 没有 死 锁 的 风险 。 清 单 3.6 中 的 例子 展示 了 如 何 
使 用 它 来 完成 简单 的 交换 操作 。 


清单 3.6 在 交换 操作 中 使 用 std::lock() 和 std::lock guard 


class some big object; 
void swap(some big object& lhs,some big object& rhs); 


class X 
{ 
private: 
some big object some detail; 
Std::mutex m; 
public: 
X(some big object const& sd):some detail(sd)() 


friend void swap(X& lhs, X& rhs) 


{ 


if (&lhs==&rhs) 


return; ag 
std::lock(lhs.m,rhs.m) ; 
std::lock_guard<std::mutex> lock _a(lhs.m,std::adopt_ lock) ; -©@ 
std::lock _guard<std: :mutex> lock_b(rhs.m, std::adopt_lock) ; 
swap (lhs.some_detail, rhs.some | detail); P 


) 
jan 

首先 , 检查 参数 以 确保 它们 是 不 同 的 实例 ,因为 试图 在 你 已 经 锁定 了 的 std: :mutex 上 
获取 锁 ， 是 未 定义 的 行为 。( 人 允许 同一 线程 多 重 锁定 的 互 斥 元 类 型 为 std: :recursive_ 
mutex。 详 见 3.3:3 节 ) 然后 ,调用 std::lock () 锁定 这 两 个 互 斥 元 @， 同时 构造 两 个 
std: :lock guard 的 实例 @@ ， 每 个 实例 对 应 一 个 互 斥 元 。 额 外 提供 一 个 参数 
std::adopt lock 给 互 斥 元 , 告知 std: :1Iock guard 对 象 该 互 斥 元 已 被 锁定 , FEE 
们 只 应 沿用 互 斥 元 上 已 有 锁 的 所 有 权 ， 而 不 是 试图 在 构造 浮 数 中 锁定 互 斥 元 。 

这 就 确保 了 通常 在 受 保护 的 操作 可 能 引发 异常 的 情况 下 , 函数 退出 时 正确 地 解锁 互 
斥 元 ,这 也 考虑 到 了 简单 返回 。 此 外 ， 值 得 一 提 的 是 ， 在 对 stds: lock 的 调用 中 锁定 
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Lhs .m 抑或 是 rhs.m 都 可 能 引发 异常 ， 在 这 种 情况 下 ， 该 异常 被 传播 出 std: :10ck, 
如 果 std::lock 已 经 成 功 地 在 一 个 互 斥 元 上 获取 了 锁 ， 当 它 试 图 在 另 一 个 互 斥 元 上 获 
取 锁 的 时 候 ， 就 会 引发 异常 ， 前 一 个 互 斥 元 将 会 自动 释放 。std: :1ock 提供 了 关于 锁 
定 给 定 的 互 斥 元 的 全 或 无 的 语义 。 

AE std: : lock 能 够 帮助 你 在 需要 同时 获得 两 个 或 更 多 锁 的 情况 下 避免 死 锁 ， 但 
是 如 果 要 分 别 获 取 锁 ， 就 没 用 了 。 在 这 种 情况 下 ， 你 必须 依靠 你 作为 开发 人 员 的 戒律 ， 
以 确保 不 会 得 到 死 锁 。 这 谈何容易 ， 死 锁 是 在 编写 多 线程 代码 时 遇 到 的 最 令 人 头疼 的 问 
题 之 一 ， 而 且 往 往 无 法 预测 ， 大 部 分 时 间 内 一 切 都 工作 正常 。 然 而 ， 有 一 些 相 对 简单 的 
规则 可 以 帮助 你 写 出 无 死 锁 的 代码 。 


3.2.5 ”避免 死 锁 的 进一步 指南 


死 锁 并 不 仅仅 产生 于 锁定 ， 虽 然 这 是 最 常见 的 诱因 。 你 可 以 通过 两 个 线程 来 制造 死 锁 ， 
不 用 锁定 ， 只 需 令 每 个 线程 在 std: : thread 对 象 上 为 另 一 线程 调用 join () 。 在 这 种 情 
况 下 ， 两 个 线程 都 无 法 取得 进展 ， 因 为 正 等 着 另 一 个 线程 完成 ， 就 像 孩子 们 争夺 他 们 的 玩 
具 。 这 种 简单 的 循环 可 以 发 生 在 任何 地 方 ， 一 个 线程 等 待 另 一 个 线程 执行 一 些 动作 而 另 一 
个 线程 同时 又 在 等 待 第 一 个 线程 ， 而 且 这 不 仅 限于 两 个 线程 ， 三 个 或 更 多 线程 的 循环 也 会 
导致 死 锁 。 避 免 死 锁 的 准则 全 都 可 以 归结 为 一 个 思路 ， 如 果 有 另外 一 个 线程 有 可 能 在 等 竺 
你 ， 那 你 就 别 等 它 。 这 个 独特 的 准则 为 识别 和 消除 别 的 线程 等 待 你 的 可 能 性 提供 了 方法 。 


1. ERREN 


第 一 个 思路 是 最 简单 的 ， 如 果 你 已 经 持 有 一 个 锁 ， 就 别 再 获取 锁 。 如 果 你 坚持 这 个 
准则 ， 光 赁 使 用 锁 是 不 可 能 导致 死 锁 的 ， 因 为 每 个 线程 仅 持 有 一 个 锁 。 你 仍然 会 从 其 他 
事情 〈 像 是 线程 相互 等 待 ) 中 得 到 死 锁 ， 但 是 互 斥 元 锁定 可 能 死 锁 最 常见 的 诱因 。 如 果 
需要 获取 多 个 锁 ， 为 了 避免 死 锁 ， 就 以 std: : lock 的 单个 动作 来 实行 。 


2， 在 持 有 锁 时 ， 避 免 调 用 用 户 提供 的 代码 


这 是 前 面 一 条 准则 的 简单 后 续 。 因 为 代码 是 用 户 提供 的 ， 你 不 知道 它 会 做 什么 ， 它 
可 能 做 包括 获取 锁 在 内 的 任何 事情 。 如 果 你 在 持 有 锁 时 调用 用 户 提供 的 代码 ， 并 且 这 段 
代码 获取 一 个 锁 ， 你 就 违反 了 避免 壬 套 锁 的 准则 ， 可 能 导致 死 锁 。 有 时 候 这 是 无 法 避免 
的 。 如 果 你 在 编写 泛 型 代码 ， 如 3.2.3 节 中 的 堆栈 ， 在 参数 类 型 上 的 每 一 个 操作 都 是 用 
户 提供 的 代码 。 在 这 种 情况 下 ， 你 需要 新 的 准则 。 


3. 以 固定 顺序 获取 锁 
如 果 你 绝对 需要 获取 两 个 或 更 多 的 锁 ， 并 且 不 能 以 std: : lock 的 单个 操作 取得 ， 
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次 优 的 做 法 是 在 每 个 线程 中 以 相同 的 顺序 获取 它们 。 我 在 3.2.4 节 中 曾 谈 及 此 点 ， 是 
作为 在 获取 两 个 互 斥 元 时 避免 死 锁 的 方法 ， 关 键 是 要 以 一 种 在 线程 间 相 一 致 的 方法 来 定 
义 其 顺序 。 在 某 些 情况 下 ， 这 是 相对 简单 的 。 例 如 ， 看 一 看 3.2.3 节 中 的 堆栈 一 一 互 斥 
元 在 每 个 栈 实例 的 内 部 ， 但 对 于 存储 在 栈 中 的 数据 项 的 操作 ， 则 需要 调用 用 户 提供 
的 代码 。 然 而 ， 你 可 以 添加 约束 ， 对 于 存储 在 栈 中 的 数据 项 的 操作 ， 都 不 应 对 栈 本 
身 进 行 任何 操作 。 这 样 就 增加 了 栈 的 使 用 者 的 负担 ， 但 是 将 数据 存储 在 一 个 容器 中 
来 访问 该 容器 是 很 罕见 的 ， 并 且 一 旦 发 生 就 会 十 分 明显 ， 因 此 这 并 不 是 一 个 很 难 承 
受 的 负担 。 

在 别 的 情况 下 ， 可 能 就 不 那么 直观 ， 就 像 在 3.2.4 节 中 你 所 看 到 的 交换 操作 那样 。 
至 少 在 这 种 情况 下 ， 你 可 以 同时 锁定 这 些 互 斥 元 ， 但 并 不 总 是 可 能 的 。 如 果 你 回顾 一 下 
3.1 节 中 链表 的 例子 ， 你 会 看 到 一 种 保护 链表 的 可 能 性 ， 就 是 让 每 个 结 点 都 有 一 个 互 斥 
元 。 然 后 ， 为 了 访问 这 个 链表 ， 线 程 必须 获取 它们 感 兴趣 的 每 个 结 点 上 的 锁 。 对 于 一 
个 删除 某 项 的 线程 , 它 就 必须 获得 三 个 结 点 上 的 锁 , 要 删除 的 结 点 以 及 它 两 边 的 结 点 ， 
因为 它们 全 都 要 以 某 种 方式 进行 修改 。 同 样 地 ， 为 了 遍历 链表 ， 线 程 在 获取 序列 中 下 
一 个 结 点 上 的 锁 的 时 候 ， 必 须 保 持 当前 结 点 上 的 锁 ， 以 确保 指向 下 一 结 点 的 指针 在 此 
期 间 不 被 修改 。 一 旦 获取 到 下 一 个 结 点 上 的 锁 ， 就 可 以 释放 前 面 结 点 上 的 锁 ， 因 为 它 
已 经 没 用 了 。 

这 种 逐 节 向 上 的 锁定 方式 允许 多 线程 访问 链表 ， 前 提 是 每 个 线程 访问 不 同 的 结 点 。 
然而 ,为 了 避免 死 锁 ， 必 须 始终 以 相同 的 顺序 锁定 结 点 。 如 果 两 个 线程 试图 用 逐 节 锁定 
的 方式 以 相反 的 顺序 遍历 链表 ， 它 们 就 会 在 链表 中 间 产生 相互 死 锁 。 如 果 结 点 A 和 B 
在 链表 中 相 邻 ， 一 个 方向 上 的 线程 会 试图 保持 锁定 结 点 A， 并 尝试 获取 结 点 B 上 的 锁 。 
而 另 一 个 方向 上 的 线程 会 保持 锁定 结 点 B, 并 且 尝试 获得 结 点 A 上 的 锁 一 一 死 锁 的 典型 
情况 。 

同样 地 ， 当 删除 位 于 结 点 A 和 C 之 间 的 结 点 B 时 ,如 果 该 线程 在 获取 结 点 A 和 
C 上 的 锁 之 前 获取 B 上 的 锁 ， 它 就 有 可 能 与 遍历 链表 的 线程 产生 死 锁 。 这 样 的 线程 
会 试图 首先 锁定 A 或 C (取决 于 遍历 的 方向 ) , 但 是 它 接 下 来 会 发 现 无 法 获得 结 点 B 
上 的 锁 ， 因 为 正在 进行 删除 操作 的 线程 持 有 了 结 点 B 上 的 锁 ， 并 试图 获得 结 点 A 和 
C 上 的 锁 。 

在 这 里 防止 死 锁 的 一 个 办 法 是 定义 遍历 的 顺序 , 让 线程 必须 始终 在 锁定 B 之 前 锁定 
A、 在 锁定 C 之 前 锁定 B。 该 方法 以 禁止 反 向 遍历 为 代价 来 消除 产生 死 锁 的 可 能 。 对 于 
其 他 数据 结构 ， 常 常会 建立 类 似 的 约定 。 


4. 使 用 锁 层 次 


虽然 这 实际 上 是 定义 锁定 顺序 的 一 个 特例 ， 但 锁 层 次 能 够 提供 一 种 方法 ， 来 检查 在 
运行 时 是 否 遵循 了 约定 。 其 思路 是 将 应 用 程序 分 层 ， 并 且 确 认 所 有 能 够 在 任意 给 定 的 层 


48 


第 3 章 在 线程 间 共 享 数据 


级 上 被 锁定 的 互 斥 元 。 当 代码 试图 锁定 一 个 互 斥 元 时 ， 如 果 它 在 较 低 层 已 经 持 有 锁定 ， 
那么 就 不 允许 它 锁定 该 互 斥 元 。 通 过 给 每 一 个 互 斥 元 分 配 层 号 ， 并 记录 下 每 个 线程 都 锁 
定 了 哪些 互 斥 元， 你 就 可 以 在 运行 时 进行 检查 了 。 清 单 3.7 列 出 了 两 个 线程 使 用 层次 互 
斥 元 的 例子 。 


清单 3.7 ”使 用 锁 层 次 来 避免 死 锁 


hierarchical mutex high level mutex(10000); 0 
hierarchical mutex low level mutex(5000); «9 


int do low level stuff(); 


int low level func() 


{ 
std::lock_guard<hierarchical_mutex> 1k(low_level_mutex) ; -© 
return do low level stuff(); 


) 


void high level stuff(int some param); 


void high level func() 


{ 


std: :lock_guard<hierarchical_mutex> lk(high level mutex); 0 
high level stuff(low level func()); 

E 

void thread a() +@ 


{ 


high level func(); 


hierarchical mutex other mutex(100); 0 
void do other stuff(); 


void other stuff () 
{ 


high level func(); 0 
do other stuff(); 


) 


void thread b() -© 
{ 


std: :lock_guard<hierarchical_mutex> lk(other mutex); + 
other stuff(); 


thread a() © 遵守 了 规则 ， 所 以 它 运 行 良 好 。 另 一 方面 ，thread_ b() @ 无 视 了 
规则 ， 因 此 将 在 运行 时 失败 。thread a() 调 用 high level func(), PRET 
high level mutex@ (具有 层次 值 100000) 并 接着 使 用 这 个 锁定 了 的 互 斥 元 调用 
low level func()@, 以 获得 high level stuff () 的 参数 , low level func() 
接着 锁定 了 low level mutex0, 但 是 没关系 ， 因 为 该 互 斥 元 具有 较 低 的 层次 值 
50008, 
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在 另 一 方面 thread b () 却 不 妥 。 刚 开始 ， 它 锁定 了 other_mutex@， 它 具 有 
的 层次 值 仅 为 100@。 这 意味 着 它 应 该 是 保护 着 超 低 级 别 的 数据 。 34 other stuff() 
调用 high level func() OW, 就 会 违反 层次 。high level func () 试图 获取 值 
为 10000 的 high level mutex ， 大 大 超过 100 的 当前 层次 值 。 因 此 ， 
hierarchical mutex 可 能 通过 引发 异常 或 终止 程序 来 报错 。 层 次 互 斥 元 之 间 的 死 
锁 是 不 可 能 出 现 的 ， 因 为 互 斥 元 本 身 实 行 了 锁定 顺序 。 这 还 意味 着 如 果 两 个 锁 在 层 
次 中 处 于 相同 级 别 ， 你 就 不 能 同时 持 有 它们 ， 因此 逐 节 锁定 的 方案 要 求 链条 中 的 每 
个 互 斥 元 具有 比 前 一 个 互 斥 元 更 低 的 层次 值 ， 在 某 些 情况 下 这 可 能 是 不 切实 际 的 。 

这 个 例子 也 展现 了 另外 一 点 , 带 有 用 户 定义 的 互 斥 元 类 型 的 std: :lock guarde? 
模板 的 使 用 。hierarchical mutex 不 是 标准 的 一 部 分 ， 但 易于 编写 。 清单 3.8 中 展 
示 了 一 个 简单 的 实现 。 即 便 它 是 个 用 户 定义 的 类 型 ， 但 是 可 以 用 于 std: :lock_ 
guard<>, 这 是 因为 它 实现 了 满足 互 斥 元 概念 所 需要 的 三 个 成 员 函 数 : lock(), 
unlock () Ñi tzy lock O 。 你 还 没有 见 过 直接 使 用 try_lock () ,但 它 是 相当 简单 的 。 
如 果 互 斥 元 上 的 锁 已 被 另 一 个 线程 持 有 , 则 返回 false, 而 非 一 直 等 到 调用 线程 可 以 获 
取 该 互 斥 元 上 的 锁 。tzy_lock () 也 可 以 在 std: :lock () 内 部 ， 作为 避免 死 锁 算法 的 
一 部 分 来 使 用 。 


清单 3.8 简单 的 分 层次 互 斥 元 
class hierarchical mutex 

{ 

std::mutex internal_mutex; 

unsigned long const hierarchy_value; 

unsigned long previous_hierarchy_value; 

static thread_local unsigned long this thread hierarchy value; 0 


void check for hierarchy violation() 


if(this thread hierarchy value «- hierarchy, value) 0 
{ 
throw std::logic_error (“mutex hierarchy violated”) ; 


} 


void update_hierarchy_value() 

{ 
previous_hierarchy_value=this_thread_hierarchy_value; -© 
this thread hierarchy_value=hierarchy_value; 

) 

public: 

explicit hierarchical mutex(unsigned long value): 
hierarchy value(value), 
previous hierarchy value (0) 


Ü 
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void lock() 


check for hierarchy violation(); 
internal mutex.lock(); <0 
update hierarchy value(); -© 


void unlock() 


{ 
this thread hierarchy value-previous hierarchy value; +@ 
internal mutex.unlock(); 


bool try lock() 


check for hierarchy violation(); 

if(!internal mutex.try lock()) ^9 
return false; 

update hierarchy value(); 

return true; 


} 

bs 

thread local unsigned long 9 
hierarchical mutex::this thread hierarchy value (ULONG MAX); 


这 里 的 关键 是 使 用 thread local 的 值 来 表示 当前 线程 的 层次 值 ， this_thread_ 
hierarchy value®, 它 被 初始 化 为 最 大 值 @,， 所 以 在 刚 开 始 的 时 候 任意 互 斥 元 都 可 以 被 
锁定 。 由 于 它 被 声明 为 thread_1ocal， 每 个 线程 都 有 属于 自己 的 副本 ， 所 以 在 一 个 线程 
中 该 变量 的 状态 ， 完 全 独立 于 从 另 一 个 线程 中 读 取 的 该 变量 状态 。 参 阅 附录 A，A.8 节 可 以 
获得 关于 thread local 的 更 多 信息 。 

因此 ， 当 线程 第 一 次 锁定 hierarchical mutex 的 实例 时 ，this thread 
hierarchy value 的 值 为 ULONG_MAX。 就 其 本 质 而 言 ， ULONG MAX 比 其 他 任意 值 都 
K, 所 以 通过 了 check for hierarchy violation()@ 中 的 检查 。 在 检查 通过 
Z, lock () 代理 内 部 的 互 斥 元 用 以 实际 锁定 @。 一旦 该 锁定 成 功 , 就 可 以 更 新 层 
次 值 @。 

现在 如 果 在 持 有 第 一 个 hierarchical mutex 上 的 锁 的 同时 ， 锁 定 另 一 个 
hierarchical mutex, Jl] this thread hierarchy value 的 值 反映 的 是 第 一 个 
互 斥 元 的 层次 值 。 为 了 通过 检查 @ ,第 二 个 互 斥 元 的 层次 值 必须 小 于 已 经 持 有 的 互 斥 元 
的 层次 值 。 

现在 , 保存 当前 线程 之 前 的 层次 值 是 很 重要 的 , 这 样 才能 在 unlock () PRAE ©, 
否则 , 你 就 无 法 再 次 锁定 一 个 具有 更 高 层次 值 的 互 斥 元 , 即便 该 线程 并 没有 持 有 任何 锁 。 
因为 只 有 当 你 持 有 internal mutex 时 才能 保存 之 前 的 层次 值 @， 并 在 解锁 该 内 部 互 
JRZUZ BIPFECE, @， 你 可 以 安全 地 将 其 存储 在 hierarchical mutex 自身 中 ， 因 为 
它 被 内 部 互 斥 元 上 的 锁 安全 地 保护 。 

try_lock() fl lock () 工作 原理 相同 ， 只 是 ， 如 果 在 internal mutex 上 调用 
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try lock () 失败 @ ,那么 你 就 无 法 拥有 这 个 锁 ， 所 以 不 能 更 新 层次 值 ,并且 返回 false 
而 不 是 true。 

虽然 检测 是 在 运行 时 间 检查 , 但 它 至 少 不 依 赖 于 时 间 你 不 必 去 等 待 能 够 导致 死 
锁 出 现 的 罕见 情况 发 生 。 此 外 ， 需要 以 这 种 方式 划分 应 用 程序 和 互 斥 元 的 设计 流程 ， 可 
以 在 写 人 代码 之 前 帮助 消除 许多 可 能 导致 死 锁 的 原因 。 即使 你 还 没有 到 达 实 际 编写 运行 
时 间 检 测 的 那 一 步 ， 进 行 设计 练习 仍然 是 值得 的 。 


5. 将 这 些 设计 准则 扩展 到 锁 之 外 


正如 我 在 本 节 开始 时 提 到 的 , 死 锁 不 只 是 出 现 于 锁定 中 ， 它 可 以 发 生 在 任何 可 以 导 
致 循环 等 待 的 同步 结构 中 。 因 此 ， 扩展 上 面 所 述 的 准则 来 涵盖 那些 情况 也 是 值得 的 。 举 
个 例子 ， 正 如 你 应 该 尽量 避免 获取 藤 套 锁 那 样 ， 在 持 有 锁 时 等 待 一 个 线程 是 坏 主 意 ， 因 
为 该 线程 可 能 需要 获取 这 个 锁 以 继续 运行 。 类 似 地 ， 如 果 你 正 要 等 待 一 个 线程 完成 ， 指 
定 线程 层次 结构 可 能 也 是 值得 的 ， 这 样 线程 就 只 需要 等 待 低层 次 上 的 线程 。 一 个 简单 的 
做 到 这 一 点 的 方法 ， 就 是 确保 你 的 线程 在 启动 它们 的 同一 个 函数 中 被 结合 ， 就 像 3.1.2 
节 和 3.3 节 中 所 描述 的 那样 。 

一 日 你 设计 了 代码 来 避免 死 锁 ，std: : lock () 和 std::lock guard 涵盖 了 大 多 
数 简 单 锁定 的 情况 ， 但 有 时 却 需要 更 大 的 灵活 性 。 在 那 种 情况 下 ， 标 准 库 提供 了 
std::unique lock 模板。 与 std::lock_guard 类 似 ，std: :unique lock 是 在 
互 斥 元 类 型 上 进行 参数 化 的 类 模板 ， 并 且 它 也 提供 了 与 std: :lock guard 相同 的 
RAII 风格 锁 管理 ， 但 是 更 加 灵活 。 


32.6 Astd::unique lock 灵活 锁定 


通过 松弛 不 变量 , std: :unique lock 比 std::lock guard 提供 了 更 多 的 灵活 
性 , 一 个 std: :unique lock 实例 并 不 总 是 拥有 与 之 相关 联 的 互 太 元。 首先 ， 就 像 你 
可 以 把 std::adopt lock 作为 第 二 参数 传递 给 构造 函数 ， 以 便 让 锁 对 象 来 管理 互 斥 
元 上 的 锁 那样 ， 你 也 可 以 把 std::defer lock 作为 第 二 参数 传递 ， 来 表示 该 互 斥 元 
在 构造 时 应 保持 未 被 锁定 。 这 个 锁 就 可 以 在 这 之 后 通过 在 std: :unique lock 对 象 
(不 是 互 斥 元 ) 上 调用 lock() ， 或 是 通过 将 std::unique lock 对 象 本 身 传递 给 
std: :lock() 来 获取 。 使 用 std::unique lock 和 std: :defer lock@， 而 不 是 
std::lock guard fl std: :adopt_lock, 能 够 很 容易 地 将 清单 3.6 写成 清单 3.9 中 
所 示 的 那样 。 这 上段 代码 具有 相同 的 行 数 ， 并 且 本 质 上 是 等 效 的 ， 除 了 一 个 小 问题 ， 
std: :unique lock 占用 更 多 空间 并 且 使 用 起 来 比 sta: :lock guard 略 慢 。 人 允许 
std: :unique lock 实例 不 拥有 互 斥 元 的 灵活 性 是 有 代价 的 ， 这 条 信息 必须 被 存储 ， 
并 且 必 须 被 更 新 。 
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清单 3.9 在 交换 操作 中 使 用 std::lock() 和 和 std::unique lock 


class some big object; 
void swap(some big object& lhs,some big object& rhs); 


class X 


private: 
Some big object some detail; 
std::mutex m; 
public: 
X(some big object const& sd):some detail(sd)() 


std::defer lock 保留 互 斥 
friend void swap(X& lhs, X& rhs) 元 为 未 锁定 


if (&lhs--&rhs) 

i bach lock a(1lhs.m,std::defer lock); 
Std::unique lock«std::mutex» lock b(rhs.m,std::defer lock); 
Std::lock(lock a,lock b); 

swap(lhs.some detail,rhs.some detail) 7 ^l 互 斥 元 在 这 里 
被 锁定 

在 清单 3.9 rH, std::unique lock 对 象 能 够 被 传递 给 std::lock()@, FY 
std::unique lock 提供 了 lock(), try lock() 和 unlock () 三 个 成 员 函 数 。 它 
们 会 转发 给 底层 互 斥 元 上 同名 的 成 员 函 数 去 做 实际 的 工作 ， 并 且 只 是 更 新 在 
std::unique lock 实例 内 部 的 一 个 标识 ， 来 表示 该 实例 当前 是 否 拥 有 此 互 斥 元 。 为 
了 确保 unlock O 在 析 构 函数 中 被 正确 调用 ， 这 个 标识 是 必需 的 。 如 果 该 实例 确 已 拥 
有 此 互 斥 元 , 则 析 构 函数 必须 调用 unlock(), 并且， 如果 该 实例 并 未 拥有 此 互 斥 元 ， 
则 析 构 函数 绝 不 能 调用 unlock () 。 可 以 通过 调用 owns lock () 成员 函数 来 查询 这 
个 标识 。 

如 你 所 想 ， 这 个 标识 必须 被 存储 在 某 个 地 方 。 因 此 ，std: :unique_lock 对 象 的 
大 小 通常 大 于 std::lock guard 对 象 ， 并 且 相 比 于 Std::lock guard, 使 用 
std::unique lock 的 时 候 ， 会 有 些许 性 能 损失 ， 因 为 需要 对 标识 进行 相应 的 更 新 或 
检查 。 如 果 std::lock guard 足以 满足 需求 ， 我 会 建议 优先 使 用 它 。 也 就 是 说 ， 还 
有 一 些 使 用 std::unique lock 更 适合 于 手头 任务 的 情况 ， 因 为 你 需要 利用 额外 的 灵 
活性 。 一 个 例子 就 是 延迟 锁定 ， 正 如 你 已 经 看 到 的 ， 另 一 种 情况 是 锁 的 所 有 权 需 要 从 一 
个 作用 域 转移 到 另 一 个 作用 域 。 


3.2.7 ”在 作用 域 之 间 转 移 锁 的 所 有 权 


因为 std: :unique_lock 实例 并 没有 拥有 与 其 相关 的 互 斥 元 ,所 以 通过 四 处 移动 
(moving) 实例 ， 互 斥 元 的 所 有 权 可 以 在 实例 之 间 进行 转移 。 在 某 些 情况 下 这 种 转移 是 
目 动 的 , 比如 从 函数 中 返回 一 个 实例 , 而 在 其 他 情况 下 , 你 必须 通过 调用 std: :move () 
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来 显 式 实现 。 从 根本 上 说 ， 这 取决 于 源 是 否 为 左 值 Clvalue) 实 变量 或 对 实 变量 的 
引用 一 一 或 者 是 右 值 (rvalue) 一 一 某 种 临时 量 。 如 果 源 为 右 值 ， 则 所 有 权 转 移 是 自动 
的 ， 而 对 于 左 值 ， 所 有 权 转 移 必 须 显 式 地 完成 ， 以 避免 从 变量 中 意外 地 转移 了 所 有 权 。 
std::unique_lock 就 是 可 移动 (movable) 但 不 可 复制 (copyable) 的 类 型 的 例子 。 关 于 移 
动 语义 的 详情 ， 可 参阅 附录 A 中 A.1.1 节 。 

一 种 可 能 的 用 法 ， 是 允许 函数 锁定 一 个 互 扩 元， 并 将 此 锁 的 所 有 权 转 移 给 调用 者 ， 
于 是 调用 者 接 下 来 可 以 在 同一 个 锁 的 保护 下 执行 额外 的 操作 。 下 面 的 代码 片段 展示 了 这 
样 的 例子 : 函数 get_lock() 锁定 了 互 斥 元 ， 然后 在 将 锁 返 回 给 调用 者 之 前 准备 数据 。 


std::unique lock«std::mutex» get lock() 


{ 


extern std::mutex some_mutex; 

std: :unique_lock<std::mutex> 1k(some_mutex) ; 
prepare data(); 

return lk; 


void process data() 

{ 
std: :unique_lock<std::mutex> lk(get lock()); +@ 
do something(); 


} 

因为 1k 是 在 函数 内 声明 的 自动 变量 , 它 可 以 被 直接 返回 @ 而 无 需 调用 std:: move O ; 
编译 器 负责 调用 移动 构造 函数 .Process_qata() 函数 可 以 直接 将 所 有 权 转 移 到 它 自己 
的 std::unique lock 实例 @, 并且 对 do something () 的 调用 能 够 依赖 被 正确 准 
备 了 的 数据 ， 而 无 需 另 一 个 线程 在 此 期 间 去 修改 数据 。 

通常 使 用 这 种 模式 ， 是 在 待 锁定 的 互 斥 元 依赖 于 程序 的 当前 状态 ， 或 者 依赖 于 传递 
给 返回 std: :unique lock 对 象 的 函数 的 参数 的 地 方 。 这 种 用 法 之 一 ， 就 是 并 不 直接 
返回 锁 ， 但 是 使 用 一 个 网 关 类 的 数据 成 员 ， 以 确保 正确 锁定 了 对 受 保护 的 数据 的 访问 。 
这 种 情况 下 ， 所 有 对 该 数据 的 访问 都 通过 这 个 网 关 类 ， 当 你 想 要 访问 数据 时 ， 就 获取 这 
个 网 关 类 的 实例 〈 通 过 调用 类 似 于 前 面 例子 中 的 get lock O 函数 )， 它 会 获取 锁 。 然 
后 ， 你 可 以 通过 网 关 对 象 的 成 员 函 数 来 访问 数据 。 在 完成 后 ， 销毁 网 关 对 象 ， 从 而 释放 
锁 ， 并 人 允许 其 他 线程 访问 受 保护 的 数据 。 这 样 的 网 关 对 象 很 可 能 是 可 移动 的 (因此 它 可 
以 从 函数 返回 ) ， 在 这 种 情况 下 ， 锁 对 象 的 数据 成 员 也 需要 是 可 移动 的 。 

std: :unique lock 的 灵活 性 同样 允许 实例 在 被 销毁 之 前 撤回 它们 的 锁 。 你 可 以 
使 用 unlock () 成 员 函 数 来 实现 ， 就 像 对 于 互 斥 元 那样 ，std: :unique lock 支持 与 
互 斥 元 一 样 的 用 来 锁定 和 解锁 的 基本 成 员 函 数 集合 ， 这 是 为 了 让 它 可 以 用 于 通用 函数 ， 
比如 std::lock, #£ std::unique lock 实例 被 销毁 之 前 释放 锁 的 能 力 ， 意 味 着 你 
可 以 有 选择 地 在 特定 的 代码 分 支 释 放 锁 ， 如 果 很 显然 不 再 需要 这 个 锁 ， 这 对 于 应 用 程序 
的 性 能 可 能 很 重要 。 持 有 锁 的 时 间 比 所 需 时 间 更 长 ， 会 导致 性 能 下 降 ， 因 为 其 他 等 待 该 
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锁 的 线程 ， 被 阻止 运行 超过 了 所 需 的 时 间 。 


3.2.8 锁定 在 恰当 的 粒度 


锁 粒 度 是 我 在 之 前 曾 提 到 过 的 ， 在 32.3 节 中 ; 锁 粒 度 是 一 个 文字 术语 ， 用 来 描述 
由 单个 锁 所 保护 的 数据 量 。 细 粒度 锁 保护 着 少量 的 数据 , 粗 粒度 锁 保护 着 的 大 量 的 数据 。 
选择 一 个 足够 粗 的 锁 粒 度 ， 来 确保 所 需 的 数据 都 被 保护 是 很 重要 的 ， 不 仅 如 此 ， 同 样 重 
要 的 是 ， 确 保 只 在 真正 需要 锁 的 操作 中 持 有 锁 。 我 们 都 知道 ， 带 着 满 满 一 车 杂货 在 超市 
排队 结账 ， 只 因为 正在 结账 的 人 突然 意识 到 自己 忘 了 一 些小 红 莓 桨 ， 然 后 就 跑 去 找 ， 而 
让 大 家 都 等 着 ， 或 者 收银 员 已 经 准备 好 收 钱 ， 顾 客 才 开 始 在 自己 的 手提 包 里 翻 找 钱包 ， 
是 很 令 人 抓 狂 的 。 如 果 每 个 人 去 结账 时 都 拿 到 了 他 们 想 要 的 ， 并 准备 好 了 适当 的 支付 方 
式 ， 一 切 都 更 容易 进行 。 

这 同样 适用 于 线程 ， 如 果 多 个 线程 正 等 待 着 同一 个 资源 (收银 台 的 收银 员 ) ， 然 后 ， 
如 果 任 意 线 程 持 有 锁 的 时 间 比 所 需 时 间 长 ， 就 会 增加 等 待 所 花费 的 总 时 间 (不 要 等 到 你 
已 经 到 了 收银 台 才 开始 寻找 小 红 莓 桨 )。 如 果 可 能 ， 仅 在 实际 访问 共享 数据 的 时 候 锁 定 
互 斥 元 ， 尝 试 在 锁 的 外 面 做 任意 的 数据 处 理 。 特 别 地 ， 在 持 有 锁 时 ， 不 要 做 任何 确实 很 
耗 时 的 活动 ， 比 如 文件 WO。 文 件 IO 通常 比 从 内 存 中 读 取 或 写 人 相同 大 小 的 数据 量 要 
BERAE (如 果 不 是 数 千 倍 )。 因 此 ， 除 非 这 个 锁 是 真 的 想 保护 对 文件 的 访问 ， 否 则 
在 持 有 锁 时 进行 VO 会 不 必要 地 延迟 其 他 线程 (因为 它们 在 等 待 获 取 锁 时 会 阻塞 )， 洲 
在 地 消除 了 使 用 多 线程 带 来 的 性 能 提升 。 

std::unique lock 在 这 种 情况 下 运作 良好 ， 因 为 能 够 在 代码 不 再 需要 访问 共享 
数据 时 调用 unlock () ， 然 后 在 代码 中 又 需要 访问 时 再 次 调用 Lock () 。 
void get and process data() 

Std::unique lock«std::mutex» my lock(the mutex); um 在 对 process0) 的 调用 中 

Some class data to process-get next data chunk(); 不 需要 锁定 互 斥 元 

my lock.unlock(); 

result type result-process(data to process); 


my lock.lock(); ae: 
write result(data to process,result); 重新 锁定 互 斥 元 以 回 写 


) 结果 

在 调用 process O 过 程 中 不 需要 锁定 互 斥 元 ， 所 以 手动 地 将 其 在 调用 前 解锁 @， 
并 在 之 后 再 次 锁定 0, 

希望 这 是 显而易见 的 ， 如 果 你 让 一 个 互 斥 锁 保护 整个 数据 结构 ， 不 仅 可 能 会 有 更 多 
的 对 锁 的 竞争 ， 锁 被 持 有 的 时 间 也 可 能 会 减少 。 更 多 的 操作 步骤 会 需要 在 同一 个 互 斥 元 
上 的 锁 ， 所 以 锁 必 须 被 持 有 更 长 的 时 间 。 这 种 成 本 上 的 双重 打击 ， 也 是 尽 可 能 走向 细 粒 
度 锁定 的 双重 激励 。 

如 这 个 例子 所 示 ， 锁 定 在 恰当 的 粒度 不 仅 关 乎 锁定 的 数据 量 ， 这 也 是 关系 到 锁 会 被 
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持 有 多 长 时 间 ， 以 及 在 持 有 锁 时 执行 哪些 操作 。 一 般 情况 下 ， 只 应 该 以 执行 要 求 的 
操作 所 需 的 最 小 可 能 时 间 而 去 持 有 锁 。 这 也 意味 着 耗 时 的 操作 ， 比 如 获取 另 一 个 锁 
(即便 你 知道 它 不 会 死 锁 ) 或 是 等 待 IO 完成 ， 都 不 应 该 在 持 有 锁 的 时 候 去 做 ， 除 非 
绝对 必要 。 

在 清单 3.6 和 清单 3.9 中 ， 需 要 锁定 两 个 互 斥 锁 的 操作 是 交换 操作 ， 这 显然 需要 并 
发 访问 两 个 对 象 。 假 设 取 而 代 之 , 你 试图 去 比较 仅 为 普通 int 的 简单 数据 成 员 。 这 会 有 
pognis int 可 以 轻易 被 复制 ， 所 以 你 可 以 很 容易 地 为 每 个 待 比较 的 的 对 象 复制 其 数 
据 ， 同 时 只 用 持 有 该 对 象 的 锁 ， 然 后 比较 已 复制 数值 。 这 意味 着 你 在 每 个 互 斥 元 上 持 有 
锁 的 时 间 最 短 , 并 且 你 也 没有 在 持 有 一 个 锁 的 时 候 去 锁定 另外 一 个 。 清 单 3.10 展示 了 这 
样 的 一 个 类 Y， 以 及 相等 比较 运算 符 的 示例 实现 。 


清单 3.10 ”在 比较 运算 符 中 每 次 锁定 一 个 互 斥 元 


class Y 
private: 


int some detail; 
mutable std::mutex m; 


int get detail() const 


std::lock_guard<std::mutex> lock a(m); «9 
return some detail; 


) 
public: 
Y (int sd):some detail(sd)() 


friend bool operator--(Y const& lhs, Y const& rhs) 
if (&lhs==&rhs) 
return true; 
int const lhs value-lhs.get detail(); -© 
int const rhs value-rhs.get detail(); -© 
return lhs value--rhs value; 0 
} 
he 
在 这 种 情况 下 ， 比 较 运 算 符 首先 通过 调用 get detail () 成 员 函 数 获取 要 进行 比 
较 的 值 @、 日 。 此 函数 在 获取 值 的 同时 用 一 个 锁 来 保护 它 @。 比 较 运算 符 接着 比较 获取 
到 的 值 @。 但 是 请 注意 ， 这 同样 会 减少 锁定 的 时 间 ， 而 且 每 次 只 持 有 一 个 锁 (从 而 消除 
了 死 锁 的 可 能 性 ) ， 与 同时 持 有 两 个 锁 相 比 ， 这 巧妙 地 改变 了 操作 的 语义 。 在 清单 3.10 
中 ， 如 果 运 算 符 返回 true ， 意 味 着 lhs.some_detail 在 一 个 时 间 点 的 值 与 
rhs.some_detail 在 另 一 个 时 间 点 的 值 相等 。 这 两 个 值 能 够 在 两 次 读 取 之 中 以 任何 方 
式 改变 。 例 如, 这 两 个 值 可 能 在 © 和 e 之 间 进 行 了 交换 ， 从 而 使 这 个 比较 变 得 之 无意 
义 。 这 个 相等 比较 可 能 会 返回 true 来 表示 值 是 相等 的 ， 即 使 这 两 个 值 在 某 个 瞬间 从 未 
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真正 地 相等 过 。 因 此 ， 当 进行 这 样 的 改变 时 小 心 注意 是 很 重要 的 ， 操 作 的 语义 不 能 以 有 
问题 的 方式 而 被 改变 ,如果 你 不 能 在 操作 的 整个 持续 时 间 中 持 有 所 需 的 锁 ， 你 就 把 自己 
暴露 在 竞争 条 件 中 。 

有 时 ， 根 本 就 没有 一 个 合适 的 粒度 级 别 ， 因 为 并 非 所 有 的 对 数据 结构 的 访问 都 要 求 
同样 级 别 的 保护 。 在 这 种 情况 下 ， 使 用 替代 机 制 来 代替 普通 的 std: :mutex 可 能 才 是 
恰当 的 。 


用 于 共享 数据 保护 的 替代 工具 


虽然 互 斥 元 是 最 通用 的 机 制 ， 但 提 到 保护 共享 数据 时 ， 它 们 并 不 是 唯一 的 选择 ， 还 
有 别 的 蔡 代 品 ， 可 以 在 特定 情况 下 提供 更 恰当 的 保护 。 

一 个 特别 极端 (但 却 相当 常见 ) 的 情况 ， 就 是 共享 数据 只 在 初始 化 时 才 需 要 并 发 访 
问 的 保护 ， 但 在 那 之 后 却 不 需要 显 式 同步 。 这 可 能 是 因为 数据 是 一 经 创建 就 是 只 读 的 ， 
所 以 就 不 存在 可 能 的 同步 问题 ， 或 者 是 因为 必要 的 保护 作为 数据 上 操作 的 一 部 分 被 隐 式 
地 执行 。 在 任 一 情况 中 ， 在 数据 被 初始 化 之 后 锁定 互 斥 元 ， 纯 粹 是 为 了 保护 初始 化 ， 这 
是 不 必要 的 ， 并 且 对 性 能 会 产生 的 不 必要 的 打击 。 为 了 这 个 原因 ，C++ 标 准 提供 了 一 种 
机 制 ， 纯 粹 为 了 在 初始 化 过 程 中 保护 共享 数据 。 


在 初始 化 时 保护 共享 数据 


假设 你 有 一 个 构造 起 来 非常 昂贵 的 共享 资源 ， 只 有 当 实 际 需要 时 你 才 会 要 这 样 做 。 
也 许 ， 它 会 打开 一 个 数据 库 连 接 或 分 配 大 量 的 内 存 。 像 这 样 的 延迟 初始 化 〈lazy 
initialization) 在 单线 程 代码 中 是 很 常见 的 一 一 每 个 请 求 资源 的 操作 首先 检查 它 是 否 已 
经 初始 化 ， 如 果 没 有 就 在 使 用 之 前 初始 化 之 。 
std: :shared ptr«some resource» resource ptr; 


void foo() 


if(!resource ptr) 


resource ptr.reset(new some resource); +@ 


} 


resource ptr-»do something(); 


如 果 共 享 资 源 本 身 对 于 并 发 访问 是 安全 的 ， 当 将 其 转换 为 多 线程 代码 时 唯一 需要 保 
护 的 部 分 就 是 初始 化 @, 但 是 像 清单 3.11 中 这 样 的 朴素 的 转换 ,会 引起 使 用 该 资源 的 线 
程 产生 不 必要 的 序列 化 。 这 是 因为 每 个 线程 都 必须 等 待 互 斥 元 ， 以 检查 资源 是 否 已 经 补 
初始 化 。 
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清单 3.11 使 用 互 斥 元 进行 线程 安全 的 延迟 初始 化 


Std::shared ptr«some resource» resource ptr; 
std::mutex resource mutex; 


void foo() 、 

( ini 所 有 的 线程 在 这 里 被 序 
std::unique lock«std::mutex» 1k (resource_mutex) ; 列 化 
if(!resource ptr) 

{ 
resource ptr.reset(new some resource); 只 有 初始 化 需要 
lk.unlock(); 被 保护 


resource ptr-»do something(); 


) 


这 段 代 码 是 很 常见 的 ， 不 必要 的 序列 化 问题 已 足够 大 ， 以 至 于 许多 人 都 试图 想 出 一 
个 更 好 的 方法 来 实现 , 包括 臭名 昭著 的 二 次 检查 锁定 (Double-Checked Locking) 模式 ， 
在 不 获取 锁 @ (在 下 面 的 代码 中 ) 的 情况 下 首次 读 取 指针 ， 并 仅 当 此 指针 为 NULL 时 获 
得 该 锁 。 一 旦 已 经 获取 了 锁 ， 该 指针 要 被 再 次 检查 @ (这 就 是 二 次 检查 的 部 分 )， 以 防 
止 在 首次 检查 和 这 个 线程 获取 锁 之 间 ， 另 一 个 线程 就 已 经 完成 了 初始 化 。 


void undefined behaviour with double checked locking () 


if (!resource_ptr) 0 
{ 


std::lock_guard<std: :mutex> 1k (resource_mutex) ; 
if (!resource_ptr) 


{ 
} 


resource ptr.reset (new some resource); +6 


resource ptr-»do something(); 0 


) 


不 幸 的 是 ， 这 种 模式 因 某 个 原因 而 臭名 昭著 。 它 有 可 能 产生 恶劣 的 竞争 条 件 ， 因 为 
在 锁 外 部 的 读 取 @ 与 锁 内 部 由 另 一 线程 完成 的 写 人 不 同步 e. 这 就 因此 创建 了 一 个 竞争 
条 件 ， 不 仅 涵盖 了 指针 本 身 ， 还 涵盖 了 指向 的 对 象 。 就 算 一 个 线程 看 到 男 一 个 线程 写 入 
的 指针 ， 它 也 可 能 无 法 看 到 新 创建 的 some_resource 实例 ， 从 而 导致 
do something O @ 的 调用 在 不 正确 的 值 上 运行 。 这 是 一 个 竞争 条 件 的 例子 ， 该 类 型 
的 竞争 条 件 被 C++ 标准 定义 为 数据 竞争 〈data race)， 因 此 被 定 为 未 定义 行为 。 因 此 ， 
这 是 肯定 需要 避免 的 。 内 存 模 型 的 详细 讨论 参见 第 5 章 ， 包 括 了 什么 构成 数据 竞争 。 

c++ 标准 委员 会 也 发 现 这 是 一 个 重要 的 场景 ， 所 以 C++ 标准 库 提 供 了 
std::once flag 和 std::call once 来 处 理 这 种 情况 。 与 其 锁定 互 斥 元 并 且 显 式 
地 检查 指针 ， 还 不 如 每 个 线程 都 可 以 使 用 std::call once, 8j std::call once 
返回 时 ， 指 针 将 会 被 某 个 线程 初始 化 (以 完全 同步 的 方式 )， 这 样 就 安全 了 。 使 用 
std: :call once 比 显 式 使 用 互 斥 元 通常 会 有 更 低 的 开销 ， 特 别 是 初始 化 已 经 完成 的 
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时 候 ， 所 以 在 std::call once 符合 所 要 求 的 功能 时 应 优先 使 用 之 。 下 面 的 例子 展示 
了 与 清单 3.11 相同 的 操作 ， 改 写 为 使 用 std: :call_once。 在 这 种 情况 下 ， 通 过 调用 
函数 来 完成 初始 化 ,但 是 通过 一 个 带 有 函数 调用 操作 符 的 类 实例 也 可 以 很 容易 地 完成 初 
始 化 。 与 标准 库 中 接受 函数 或 者 断言 作为 参数 的 大 部 分 函数 类 似 ，std: :call once 
可 以 与 任意 函数 或 可 调用 对 象 合作 。 


Std::shared ptr«some resource» resource ptr; 
Std::once flag resource flag; 


void init resource() 
{ 
} 


void foo() 


初始 化 会 被 正好 


Std::call once(resource flag,init resource); 调用 一 次 
resource ptr-»do something(); 


resource ptr.reset(new some resource); 


在 这 个 例子 中 ,std: :once_flag@ 和 被 初始 化 的 数据 都 是 命名 空间 作用 域 的 对 象 ， 
但 是 std::call once () 可 以 容易 地 用 于 类 成 员 的 延迟 初始 化 ， 如 清单 3.12 所 示 。 


清单 3.12 使 用 std::call once 的 线程 安全 的 类 成 员 延 迟 初始 化 


class X 

private: 
connection info connection details; 
connection handle connection; 
Std::once flag connection init flag; 


void open connection() 


{ 


} 
public: 


connection-connection manager.open(connection details); 


X(connection info const& connection details ): 
connection details(connection details ) 


void send data(data packet const& data) +@ 

{ 
std: :call_once (connection_init_flag, &X::open_connection, this); 
connection.send_data(data) ; 

data packet receive data() -© 

{ 
Std::call once(connection init flag,&X::open connection,this); 
return connection.receive data(); 
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在 这 个 例子 中 ， 初 始 化 由 首次 调用 send _data()@ 或 是 由 首次 调用 receive. 
data () @ 来 完成 。 使 用 成 员 函 数 open connection () 来 初始 化 数据 ， 同 样 需要 将 this 
指针 传人 函数 。 和 标准 库 中 其 他 接受 可 调用 对 象 的 函数 一 样 ， 比 如 std: :thread 和 
std: :bind() 的 构造 函数 ， 这 是 通过 传递 一 个 额外 的 参数 给 std: :call once ()3K 
完成 的 e. 

值得 注意 的 是 , 像 std: :mutex, std::once flag 的 实例 是 不 能 被 复制 或 移动 
的 ， 所 以 如 果 想 要 像 这 样 把 它们 作为 类 成 员 来 使 用 ， 就 必须 显 式 定义 这 些 你 所 需要 的 特 
殊 成 员 函 数 。 

一 个 在 初始 化 过 程 中 可 能 会 有 竞争 条 件 的 场景 ， 是 将 局 部 变量 声明 为 static 的 。 
这 种 变量 的 初始 化 ,被 定义 为 在 时 间 控 制 首次 经 过 其 声明 时 发 生 。 对 于 多 个 调用 该 函数 
的 线程 ， 这 意味 着 可 能 会 有 针对 定义 “首次 ”的 竞争 条 件 。 在 许多 C++11 之 前 的 编译 器 
上 ,这 个 竞争 条 件 在 实践 中 是 有 问题 的 ， 因 为 多 个 线程 可 能 都 认为 它们 是 第 一 个 ， 并 试 
图 去 初始 化 该 变量 ， 又 或 者 线程 可 能 会 在 初始 化 已 在 另 一 个 线程 上 启动 但 尚未 完成 之 时 
试图 使 用 它 。 在 C++11 中 , 这 个 问题 得 到 了 解决 。 初始 化 被 定义 为 只 发 生 在 一 个 线程 上 ， 
并 且 其 他 线程 不 可 以 继续 直到 初始 化 完成 , 所 以 竞争 条 件 仅仅 在 于 哪个 线程 会 执行 初始 
化 ， 而 不 会 有 更 多 别 的 问题 。 对 于 需要 单一 全 局 实例 的 场合 ， 这 可 以 用 作 
std: :call once 的 替代 品 。 


class my class; 
my class& get my class instance() 
初始 化 保证 线程 是 
Static my class instance; 安全 的 
return instance; 


多 个 线程 可 以 继续 安全 地 调用 get my class instance 0 0, 而 不 必 担 心 初始 
化 时 的 竞争 条 件 。 

保护 仅 用 于 初始 化 的 数据 是 更 普遍 的 场景 下 的 一 个 特例 ， 那些 很 少 更 新 的 数据 结 
构 。 对 于 大 多 数 时 间 而 言 ， 这 样 的 数据 结构 是 只 读 的 ， 因而 可 以 毫 无 顾忌 地 被 多 个 线程 
同时 读 取 ， 但 是 数据 结构 偶尔 可 能 需要 更 新 。 这 里 我 们 所 需要 的 是 一 种 承认 这 一 事实 的 
保护 机 制 。 


3.3.2 ”保护 很 少 更 新 的 数据 结构 


假设 有 一 个 用 于 存储 DNS 条 目 缓存 的 表 ， 它 用 来 将 域名 解析 为 相应 的 地 址 。 通 
常 ， 一 个 给 定 的 DNS 条 目 将 在 很 长 一 段 时 间 里 保持 不 变 一 一 在 许多 情况 下 ，DNS 条 目 
会 保持 数 年 不 变 。 虽然 随 着 用 户 访问 不 同 的 网 站 , 新 的 条 目 可 能 会 被 不 时 地 添加 到 表 中 ， 
但 这 一 数据 却 将 在 其 整个 生命 中 基本 保持 不 变 。 定 期 检查 缓存 条 目的 有 效 性 是 很 重要 
的 ， 但 是 只 有 在 细节 已 有 实际 改变 的 时 候 才 会 需要 更 新 。 
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虽然 更 新 是 罕见 的 ， 但 它们 仍然 会 发 生 ， 并 且 如 果 这 个 缓存 可 以 从 多 个 线程 访问 ， 
它 就 需要 在 更 新 过 程 中 进行 适当 的 保护 ， 以 确保 所 有 线程 在 读 取 缓 存 时 都 不 会 看 到 损坏 
的 数据 结构 。 

在 缺乏 完全 符合 预期 用 法 并 且 为 并 发 更 新 与 读 取 专门 设计 (例如 在 第 6 章 和 第 7 3€ 
的 那些 ) 的 专用 数据 结构 的 情况 下 , 这 种 更 新 要 求 线程 在 进行 更 新 时 独占 访问 数据 结构 ， 
直到 它 完 成 了 操作 。 一 旦 更 新 完成 ， 该 数据 结构 对 于 多 线程 并 发 访问 又 是 安全 的 了 。 使 
用 std::mutex 来 保护 数据 结构 就 因而 显得 过 于 悲观 ， 因 为 这 会 在 数据 结构 没有 进行 
修改 时 消除 并 发 读 取 数 据 结构 的 可 能 ， 我们 需要 的 是 另 一 种 互 斥 元 。 这 种 新 的 互 斥 元 通 
常 称 为 读 写 (reader-writer) 互 斥 元 ， 因 为 它 考 虑 到 了 两 种 不 同 的 用 法 : 由 单个 “ 写 ” 
线程 独占 访问 或 共享 ， 由 多 个 “ 读 ” 线 程 并 发 访问 。 

新 的 C++ 标准 库 并 没有 直接 提供 这 样 的 互 斥 元 ， 尽 管 已 向 标准 委员 会 提议 !。 由 于 
这 个 建议 未 被 接纳 ， 本 节 中 的 例子 使 用 由 Boost 库 提供 的 实现 ， 它 是 基于 这 个 建议 的 。 
在 第 8 章 中 你 会 看 到 ， 使 用 这 样 的 互 斥 元 并 不 是 万 能 药 ， 性 能 依赖 于 处 理 器 的 数量 以 及 
读 线程 和 更 新 线程 的 相对 工作 负载 。 因 此 ， 分 析 代 码 在 目标 系统 上 的 性 能 是 很 重要 的 ， 
以 确保 额外 的 复杂 度 会 有 实际 的 收益 。 

你 可 以 使 用 boost::shared mutex 的 实例 来 实现 同步 ， 而 不 是 使 用 
std: :mutex 的 实例 。 对 于 更 新 操作 , std: :lock guard«boost::shared mutex» 
和 std::unique lock«boost::shared mutex> 可 用 于 锁定 ， 以 取代 相应 的 
std::mutex 特 化 。 这 确保 了 独占 访问 ， 就 像 std: :mutex 那样 。 那 些 不 需要 更 新 数 
据 结构 的 线程 能 够 转 而 使 用 boost::shared lock«boost::shared mutex> 来 获 
得 共享 访问 。 这 与 std: :uniaue lock 用 起 来 正 是 相同 的 , 除了 多 个 线程 在 同一 时 间 、 
同一 boost: :share mutex 上 可 能 会 具有 共享 锁 。 唯 一 的 限制 是 , 如 果 任 意 一 个 线程 
拥有 一 个 共享 锁 ， 试 图 获取 独占 锁 的 线程 会 被 阻塞 ， 直 到 其 他 线程 全 都 撤回 它们 的 锁 ， 
同样 地 ， 如 果 任 意 一 个 线程 具有 独占 锁 ， 其 他 线程 都 不 能 获取 共享 锁 或 独占 锁 ， 直到 第 
一 个 线程 撤回 了 它 的 锁 。 

清单 3.13 展示 了 一 个 简单 的 如 前 面 所 描述 的 DNS 缓存 , 使 用 std: :map 来 保存 绥 
存 数据 ， 用 boost::share mutex 进行 保护 。 


清单 3.13 ”使 用 boost::share_mutex 保护 数据 结构 
#include «map» 

#include <string> 

#include <mutex> 

#include <boost/thread/shared_mutex.hpp> 


! Howard E. Hinnant, “Multithreading API for C---0X—A Layered Approach”, C++ Standards Committee 
Paper N2094, http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2006/n2094.html 
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class dns entry; 


class dns cache 
{ 
std::map«std::string,dns entry» entries; 
mutable boost::shared mutex entry mutex; 
publie: 
dns entry find entry(std::string const& domain) const 


boost : :shared_lock<boost: : shared_mutex> 1k (entry_mutex) ; 0 

std::mapestd::string,dns entry»::const iterator const it- 
entries.find (domain); 

return (ite-entries.end())?dns entry():it-»second; 


) 

void update or add entry(std::string const& domain, 
dns entry const& dns details) 

{ 


std: :lock_guard<boost::shared_mutex> lk(entry mutex); +O 
entries [domain]-dns details; 
Y ) 

在 清单 3.13 中 ,find_entry() 使 用 一 个 boost: :share lock<> 实 例 来 保护 它 ， 
以 供 共享 、 只 读 的 访问 @， 多 个 线程 因而 可 以 毫 无 问题 地 同时 调用 find_entry(). 
另 一 方面 ， update or add entry() 使 用 一 个 std: :lock_guard<> 实 例 ， 在 表 被 
更 新 时 提供 独占 访问 ©, 不 仅 在 调用 update or add entry O 中 其 他 线程 被 阻止 进 
fud, WE find entry O 的 线程 也 会 被 阻塞 。 


3.3.3 ”递归 锁 


在 使 用 std: :mutex 的 情况 下 , 一 个 线程 试图 锁定 其 已 经 拥有 的 互 斥 元 是 错误 的 ， 
并 且 试 图 这 么 做 将 导致 未 定义 行为 undefined behavior)。 然 而 ， 在 某 些 情 况 下 ， 线 程 
多 次 重新 获取 同一 个 互 斥 元 却 无 需 事先 释放 它 是 可 取 的 。 为 了 这 个 目的 ，C++ 标 准 库 提 
供 了 std::recursive mutex。 它 就 像 std: :mutex 一 样 ， 区 别 在 于 你 可 以 在 同一 
个 线程 中 的 单个 实例 上 获取 多 个 锁 。 在 互 斥 元 能 够 被 另 一 个 线程 锁定 之 前 ， 你 必须 释放 
所 有 的 锁 ， 因 此 如 果 你 调用 lock() 三 次 ， 你 必须 也 调用 unlock () 三 次 。 正 确 使 用 
std::lock guard<std: :recursive mutex> 和 std::unique_lock<std:: 
recursive mutex> 将 会 为 你 处 理 。 

大 多 数 时 间 ， 如 果 你 觉得 需要 一 个 递归 互 斥 元 ， 你 可 能 反而 需要 改变 你 的 设计 。 递 
归 互 斥 元 常用 在 一 个 类 被 设计 成 多 个 线程 并 发 访问 的 情况 中 , 因此 它 具 有 一 个 互 斥 元 来 
保护 成 员 数据 。 每 个 公共 成 员 函数 锁定 互 扩 元， 进行 工作 ， 然 后 解锁 互 斥 元 。 然 而 ， 有 
时 一 个 公共 成 员 函数 调用 另 一 个 函数 作为 其 操作 的 一 部 分 是 可 取 的 。 在 这 种 情况 下 ,第 
二 个 成 员 函 数 也 将 尝试 锁定 该 互 斥 元 ， 从 而 导致 未 定义 行为 。 粗 制 滥 造 的 解决 方案 ， 就 
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是 将 互 斥 元 改 为 递归 互 斥 元 。 这 将 允许 在 第 二 个 成 员 函 数 中 对 互 斥 元 的 锁定 成 功 进行 ， 
并 且 函 数 继续 。 

然而 , 这 样 的 用 法 是 不 推荐 的 , 因为 它 可 能 导致 草率 的 想法 和 糟糕 的 设计 。 特别 地 ， 
类 的 不 变量 在 锁 被 持 有 时 通常 是 损坏 的 ， 这 意味 着 第 二 个 成 员 函 数 需 要 工作 ， 即 便 在 被 
调用 时 使 用 的 是 损坏 的 不 变量 。 通 常 最 好 是 提取 一 个 新 的 私有 成 员 函 数 ， 该 函数 是 从 这 
两 个 成 员 函 数 中 调用 的 ， 它 不 锁定 互 斥 元 〈 它 认为 互 斥 元 已 经 被 锁定 ) 。 然 后 ， 你 可 以 
仔细 想 想 在 什么 情况 下 可 以 调用 这 个 新 函数 以 及 在 那些 情况 下 数据 的 状态 。 


小 结 


在 本 章 中 ， 我 讨论 了 在 线程 之 间 共 享 数据 时 ， 有 问题 的 竞争 条 件 如 何 成 为 灾难 ， 以 及 
怎样 使 用 std:mutex 和 精心 设计 接口 以 避免 它们 。 你 看 到 了 互 斥 元 不 是 万 能 药 ， 也 有 它 
们 自己 的 以 死 锁 形式 出 现 的 问题 ， 尽 管 C++ 标准 库 以 std: : lock () 的 形式 提供 了 工具 来 
帮助 避免 死 锁 。 然 后 ， 你 看 到 了 一 些 进一步 的 技术 来 避免 死 锁 ， 接 着 简要 看 了 一 下 锁 的 所 
有 权 的 转让 ， 以 围绕 着 为 锁 选 择 恰当 的 粒度 的 问题 。 最 后 ， 我 介绍 了 为 特定 场景 提供 的 替 
代 的 数据 保护 工具 ， 例 如 std::call once() 和 boost::shared mutex, 

然而 ， 还 有 一 件 事 我 没有 提 到 ， 就 是 等 待 来 自 其 他 线程 的 输入 。 我 们 的 线程 安全 栈 
在 栈 为 空 的 情况 下 只 是 引发 异常 ， 因 此 如 果 一 个 线程 需要 等 待 另 一 个 线程 来 将 一 个 值 压 
ARP 毕竟， 这 是 线程 安全 栈 的 主要 用 途 之 一 ) ， 它 将 不 得 不 反复 尝试 弹出 值 ， 如 果 
引发 异常 则 重 试 。 这 会 消耗 宝贵 的 处 理 时 间 来 进行 检查 ， 而 没有 实际 取得 任何 进展 。 的 
确 , 不 断 地 检查 可 能 会 通过 阻止 系统 中 其 他 线程 的 运行 而 阻碍 进度 。 我 们 需要 的 是 以 某 
种 方法 让 一 个 线程 等 待 另 一 个 线程 完成 任务 ， 而 无 需 耗费 CPU 时 间 。 第 4 章 构建 在 已 
经 讨论 过 的 用 于 保护 共享 数据 的 工具 上 ， 介 绍 了 C++ 中 用 于 线程 间 同步 操作 的 各 种 机 
制 ， 第 6 章 展示 了 如 何 使 用 它们 来 构建 更 大 的 可 复 用 的 数据 结构 。 


在 上 一 章 中 , 我 们 看 到 了 各 种 方法 去 保护 在 线程 间 共享 的 数据 。 但 是 有 时 候 你 不 只 
是 需要 保护 数据 ， 还 需要 在 独立 的 线程 上 进行 同步 操作 。 例 如 ， 一 个 线程 在 能 够 完成 其 
任务 之 前 可 能 需要 等 待 男 一 个 线程 完成 任务 。 一 般 来 说 , d 望 一 个 线程 等 待 特 定 事件 的 
发 生 或 是 一 个 条 件 变 为 true 是 常见 的 事情 。 虽 然 通 过 定期 检查 “任务 完成 ”的 标识 或 
是 在 共享 数据 中 存储 类 似 的 东西 也 能 够 做 到 这 一 点 ， 但 却 不 其 理想 。 对 于 像 这 样 的 线程 
间 同 步 操作 的 需求 是 如 此 常见 ， 以 至 于 C++ 标准 库 提 供 了 以 条 件 变量 (condition 
variables》 和 期 值 〈future〉 为 形式 的 工具 来 处 理 它 。 

在 本 章 中 ， 我 将 讨论 如 何 使 用 条 件 变 量 和 期 值 来 等 待 事件 ， 以 及 如 何 使 用 它们 来 简 
化 操作 的 同步 。 


41 等 待 事件 或 其 他 条 件 
假设 你 正 乘坐 通宵 列车 旅行 。 一 个 可 以 确保 你 在 正确 的 车 站 下 车 的 方法 就 是 整 夜 保 
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持 清 醒 并 注意 火车 停靠 的 地 方 。 你 不 会 误 站 ， 但 你 到 那儿 时 就 会 觉得 很 累 。 或 者 ， 你 可 
以 查 一 下 时 间 表 ， 了 解 火 车 会 在 何 时 到 达 ， 将 闹钟 定 的 稍微 提前 一 点 ， 然 后 去 睡觉 。 这 
是 可 以 的 ， 你 不 会 错过 站 , 但 是 如 果 火 车 晚点 了 ， 你 就 会 醒 得 太 早 。 也 有 可 能 闹钟 的 电 
池 没 电 了 ， 你 就 会 睡 过 头 以 至 于 错过 站 。 理 想 的 状况 是 ， 你 只 管 去 睡觉 ， 让 某 个 人 或 某 
个 东西 在 火车 到 站 时 叫 醒 你 ， 无 论 何 时 。 

这 如 何 与 线程 相关 呢 ? 那么 ,如 果 一 个 线程 正 等 待 着 第 二 个 线程 完成 一 项 任务 ， 它 
有 几 个 选择 。 首 先 ， 它 可 以 一 直 检查 共享 数据 (由 互 斥 元 保护 ) 中 的 标识 ， 并 且 让 第 二 
个 线程 在 完成 任务 时 设置 该 标识 。 这 有 两 项 浪费 ， 线 程 占用 了 宝贵 的 处 理 时 间 去 反复 检 
查 该 标识 ， 以 及 当 互 斥 元 被 等 待 的 线程 锁定 后 ， 就 不 能 被 任何 其 他 线程 锁定 。 两 者 都 反 
对 线程 进行 等 待 ， 因 为 它们 限制 了 等 待 中 的 线程 的 可 用 资源 ， 甚 至 阻止 它 在 完成 任务 时 
设置 标识 。 这 类 似 于 整 夜 保持 清醒 地 与 火车 司机 交谈 ， 他 不 得 不 把 火车 开 得 更 慢 ， 因 为 
你 一 直 在 干扰 他 ， 所 以 需要 更 长 的 时 间 才能 到 达 。 同 样 的 ， 等 待 中 的 线程 消耗 了 本 可 以 
被 系统 中 其 他 线程 使 用 的 资源 ， 并 且 最 终 等 待 的 时 间 可 能 会 比 所 需 的 更 长 。 

第 二 个 选择 是 使 用 std::this thread::sleep for 0 函数 (参见 4.3 47), ik 
等 待 中 的 线程 在 检查 之 间 休眠 一 会 儿 。 


bool flag; 
std::mutex m; 


void wait for flag() 


Std::unique lock«std::mutex» lk(m); 解锁 互 斥 元 
while(!flag) 
{ 休眠 100 2E 


" 
lk.unlock(); 

std::this thread::sleep for(std::chrono::milliseconds(100)); 
lk.lock(); 


} E 重新 锁定 互 斥 元 


在 这 个 循环 里 ， 函 数 在 休眠 之 前 @ 解锁 该 互 斥 元 @， 并 在 之 后 再 次 锁定 之 .@， 所 
以 另 一 个 线程 有 机 会 获取 它 并 设置 标识 。 

这 是 一 个 进步 ， 因 为 线程 在 休眠 时 并 不 浪费 处 理 时 间 ， 但 得 到 正确 的 休眠 时 间 是 很 
难 的 。 检 查 之 间 休 眼 得 过 短 ， 线 程 仍然 会 浪费 处 理 时 间 进行 检查 ， 休 有 眼 得 过 长 ， 即 使 线 
程 正在 等 待 的 任务 已 经 完成 ， 它 还 会 继续 休 眼 ， 导 致 延迟 。 这 种 过 度 休 卢 很 少 直接 影响 
程序 的 操作 ,但 它 可 能 意味 着 在 快 节 奏 的 游戏 中 丢 帧 ,或 者 在 实时 应 用 程序 中 过 度 运行 
一 个 时 间 片 。 

第 三 个 选择 ， 同 时 也 是 首选 选择 ， 是 使 用 C++ 标准 库 提供 的 工具 来 等 待 事件 本 身 。 等 
待 由 男 一 个 线程 触发 一 个 事件 的 最 基本 机 制 (例如 前 面 提 到 的 管道 中 存在 的 额外 操作 ) 是 
条 件 变量 (condition variable)。 从 概念 上 说 ， 条 件 变量 与 某 些 事件 或 其 他 条 件 相关 ， 并 且 
一 个 或 多 个 线程 可 以 等 待 该 条 件 被 满足 。 当 某 个 线程 已 经 确定 条 件 得 到 满足 ， 它 就 可 以 通 
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知 一 个 或 多 个 正在 条 件 变量 上 进行 等 待 的 线程 ， 以 便 唤醒 它们 并 让 它们 继续 处 理 。 


用 条 件 变量 等 待 条 件 


标准 C++ 库 提 供 了 两 个 条 件 变 量 的 实现 : std::condition variable 和 
std::condition variable any, 这 两 个 实现 都 在 <condition_variab1le> 库 的 
头 文件 中 声明 。 两 者 都 需要 和 互 斥 元 一 起 工作 ， 以 便 提供 恰当 的 同步 ， 前 者 仅 限于 和 
std: :mutex 一 起 工作 ,而 后 者 则 可 以 与 符合 成 为 类 似 互 斥 元 的 最 低 标 准 的 任何 东西 一 
起 工作 ， 因 此 以 _any 为 后 级 。 因 为 std: :condition variable any 更 加 普遍 ， 所 
以 会 有 大 小 、 性 能 或 者 操作 系统 资源 方面 的 形式 的 额外 代价 的 可 能 ， 因 此 应 该 首选 
std::condition variable， 除 非 需要 额外 的 灵活 性 。 

那么 , 如 何 使 用 std::condition variable 去 处 理 引 言 中 的 例子 一 一 怎么 让 正 
在 等 待 工作 的 线程 休眠 ， 直 到 有 数据 要 处 理 ? 清单 4.1 展示 了 一 种 方法 ， 你 可 以 用 条 件 
变量 来 实现 这 一 点 。 


清单 4.1 使 用 std::condition variable 等 待 数据 


std::mutex mut; 
sStd::queue«data chunk» data queue; 0 
std::condition_ variable data cond; 


void data preparation thread() 
{ 
while(more data to prepare()) 
{ 
data_chunk const data-prepare data(); 
Std::lock guard«std::mutex» lk(mut); 
data queue.push(data); 
data cond.notify one(); -© 
) 
} 


void data processing thread() 
{ 
while (true) 
{ 
std: :unique_lock<std: :mutex> lk (mut); 0 
data cond.wait( 
1k, [] {return !data queue.empty() ;]) ; 0 
data chunk data=data_queue.front () ; 
data queue.pop(); 
lk.unlock(); 
process (data); 
if(is last chunk(data)) 
break; 
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首先 , 你 拥有 一 个 用 来 在 两 个 线程 之 间 传递 数据 的 队列 @。 当 数据 就 结 时 ,准备 数 
据 的 线程 使 用 std::lock guard 去 锁定 保护 队列 的 互 斥 元 ， 并 且 将 数据 压 人 队列 中 e, 
然后 , EXE std::condition_variable 的 实例 上 调用 notify one O 成 员 函 数 ， 以 
通知 等 待 中 的 线程 (如 果 有 的 话 ) e. 

在 另外 一 侧 ， 你 还 有 处 理 线程 。 该 线程 首先 锁定 互 斥 元 ， 但 是 这 次 使 用 的 是 
std::unique lock 而 不 是 std: :lock_guard@ 一 一 你 很 快 就 会 明白 为 什么 。 该 线程 接 
下 来 在 std::condition variable 上 调用 wait () ， 传 人 锁 对 象 以 及 表示 正在 等 待 的 条 
件 的 lambda 函数 ©, lambda 函数 是 C++ 中 的 一 个 新 功能 ， 它 允许 你 编写 一 个 匿名 函数 作为 
另 一 个 表达 式 的 一 部 分 ， 它 们 非常 适合 于 为 类 似 于 wait O 这 样 的 标准 库 函 数 指定 断言 。 在 
这 个 例子 中 ,简单 的 lambda 函数 [] {return ! data queue .empty () ; } 检 查 data queue 
是 否 不 为 empty O ， 即 队列 中 已 有 数据 准备 处 理 。 附 录 A，A.5 节 更 加 详细 地 描述 了 lambda 
函数 。 

wait () 的 实现 接 下 来 检查 条 件 (通过 调用 所 提供 的 lambda 函数 ) ， 并 在 满足 时 返 
E] (lambda 函数 返回 true)。 如 果 条 件 不 满足 (lambda 函数 返回 false), wait 0 ft 
锁 互 斥 元 , 并 将 该 线程 置 于 阻塞 或 等 待 状态 。 当 来 自 数据 准备 线程 中 对 notify_one () 
的 调用 通知 条 件 变 量 时 ， 线 程 从 睡眠 状态 中 苏醒 (解除 其 阻塞 )， 重 新 获得 互 斥 元 上 的 
锁 ， 并 再 次 检查 条 件 ， 如 果 条 件 已 经 满足 ， 就 从 wait () 返回 值 ， 互 斥 元 仍 被 锁定 。 如 
果 条 件 不 满足 ， 该 线程 解锁 互 斥 元 ， 并 恢复 等 待 。 这 就 是 为 什么 需要 std::unique 
lock 而 不 是 std;; lock_guard 一 一 等 待 中 的 线程 在 等 待 期 间 必须 解锁 互 斥 元 ， 并 在 
这 之 后 重新 将 其 锁定 ， 而 std::lock guard 没有 提供 这 样 的 灵活 性 。 如 果 互 斥 元 在 
线程 休眠 期 间 始 终 被 锁定 , 数据 准备 线程 将 无 法 锁定 该 互 斥 元 , 以 便 将 项 目 添加 至 队列 ， 
并 且 等 待 中 的 线程 将 永远 无 法 看 到 其 条 件 得 到 满足 。 

清单 4.1 为 等 待 使 用 了 一 个 简单 的 lambda MAL @， 该 函数 检查 队列 是 否 为 非 空 
的 , 但 是 任何 函数 或 可 调用 对 象 都 可 以 传人 。 如 果 你 已 经 有 一 个 函数 来 检查 条 件 (也 
许 因为 它 比 这 样 一 个 简单 的 试验 更 加 复杂 )， 那 么 这 个 函数 就 可 以 直接 传人 ， 没 有 必 
要 将 其 封装 在 lambda 中 。 在 对 wait () 的 调用 中 ， 条 件 变 量 可 能 会 对 所 提供 的 条 件 
检查 任意 多 次 。 然 而 ， 它 总 是 在 互 斥 元 被 锁定 的 情况 下 这 样 做 ， 并 且 当 ( 且 仅 当 ) 
用 来 测试 条 件 的 函数 返回 true， 它 就 会 立即 返回 。 当 等 待 线程 重新 获取 互 斥 元 并 检 
查 条 件 时 ， 如 果 它 并 非 直接 响应 另 一 个 线程 的 通知 ， 这 就 是 所 谓 的 伪 了 唤醒 (spurious 
wake)。 由 于 所 有 的 这 种 伪 唤 醒 的 次 数 和 频率 根据 定义 是 不 确定 的 , 所 以 使 用 对 于 条 
件 检 查 具 有 副作用 的 函数 是 不 可 取 的 。 如 果 你 这 样 做 ， 就 必须 做 好 多 次 产生 副作用 
的 准备 。 

解锁 std: :unique lock 的 灵活 性 不 仅 适 用 于 对 wait O 的 调用 ， 它 还 可 用 于 你 
有 待 处理 但 仍 未 处 理 的 数据 @。 处 理 数据 可 能 是 一 个 耗 时 的 操作 , 并且 如 你 在 第 3 章 中 
看 到 的 ， 在 互 斥 元 上 持 有 锁 超 过 所 需 的 时 间 就 是 个 不 好 的 情况 。 
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清单 4.1 所 示 的 使 用 队列 在 线程 之 间 传 输 数据 ， 是 很 常见 的 场景 。 做 得 好 的 话 ， 同 
步 可 以 被 限制 在 队列 本 身 ， 大 大 减少 了 同步 问题 和 竞争 条 件 大 概 的 数量 。 鉴 于 此 ， 现 在 
让 我 们 从 清单 4.1 中 提取 一 个 泛 型 的 线程 安全 队列 。 


41.2 ”使 用 条 件 变量 建立 一 个 线程 安全 队列 


如 果 你 要 设计 一 个 泛 型 队列 ， 花 几 分 钟 考虑 一 下 可 能 需要 的 操作 是 值得 的 ,就 像 你 
在 3.2.3 节 对 线程 安全 堆栈 所 做 的 那样 。 让 我 们 看 一 看 C++ 标 准 库 来 寻找 灵感 ， 以 清单 
42 所 示 的 std: :queue<> 的 容器 适配器 的 形式 。 


清单 4.2 std::queue 接口 


template «class T, class Container = std::deque<T> > 
class queue ( 
public: 

explicit queue (const Container&); 

explicit queue(Container&& - Container()); 


template «class Alloc» explicit queue (const Alloc&); 

template <class Alloc> queue (const Container&, const Alloc&); 
template «class Alloc» queue(Container&&, const Alloc&); 
template «class Alloc» queue (queue&&, const Alloc&); 


void swap(queue& q); 


bool empty() const; 
size type size() const; 


T& front(); 
const T& front() const; 
T& back(); 
const T& back() const; 


void push(const T& x); 
void push(T&& x); 


void pop(); 
template «class... Args» void emplace(Args&&... args); 


PA 

MEARI. MEMZ, MABAIT 3 ARE: 查询 整个 队列 的 状态 
(empty O 和 size() )、 查 询 队列 的 元 素 (front () 和 back() ) 以 及 修改 队列 
(push () pop () 和 emplace () ) 。 这 些 操作 与 你 之 前 在 3.2.3 节 中 对 堆栈 的 操作 是 相 
同 的 ， 因 此 你 也 遇 到 相同 的 有 关 接 口中 固有 的 竞争 条 件 的 问题 。 所 以 ， 你 需要 将 
front () 和 pop O 组 合 到 单个 函数 调用 中 ， 就 像 你 为 了 堆栈 而 组 合 top O 和 pop O 
那样 。 清 单 4.1 中 的 代码 增加 了 新 的 细微 差别 ， 但 是 ， 当 使 用 队列 在 线程 间 传递 数据 
时 ,接收 线程 往往 需要 等 待 数据 。 我 们 为 pop O 提供 了 两 个 变 体 : try popl), EW 
图 从 队列 中 弹出 值 ， 但 总 是 立即 返回 〈 带 有 失败 指示 符 ) ， 即 使 没有 能 获取 到 值 。 以 及 
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wait and pop ()，, 它 会 一 直 等 待 , 直到 有 值 要 获取 。 如 果 将 栈 示例 中 的 特征 带 到 此 处 ， 
则 接口 看 起 来 如 清单 4.3 所 示 。 


清单 4.3 threadsafe queue 的 接口 


#include «memory» sn 为 了 std::shared ptr 


template«typename T» 

class threadsafe queue 

{ 

public: 
threadsafe queue(); 
threadsafe queue(const threadsafe queue&); 
threadsafe queue& operator= ( 


const threadsafe queue&) - delete; 为 简单 起 见 不 人 允许 
void push(T new value); 赋值 
bool try pop(T& value); +@ 
std::shared_ptr<T> try pop(); «e 


void wait and pop(T& value); 
std::shared ptr«T» wait and pop(); 


bool empty() const; 


ji 

就 像 你 为 堆栈 做 的 那样 ， 减 少 构造 函数 并 消除 赋值 以 简化 代码 。 如 以 前 一 样 ， 还 提 
HET try pop () 和 wait and pop O 的 两 个 版 本 。tzy_pop () 的 第 一 个 重 载 @ 将 获 
取 到 的 值 存储 在 引用 变量 中 ， 所 以 它 可 以 将 返回 值 用 作 状 态 ， 如 果 它 获取 到 值 就 返回 
true, 否则 返回 false (参见 A.2 节 )。 第 二 个 重 载 @ 不 能 这 么 做 ， 因 为 它 直 接 返 回 
获取 到 的 值 。 但 是 如 果 没 有 值 可 被 获取 ， 则 返回 的 指针 可 以 设置 为 NULL。 

那么 ， 所 有 这 一 切 如 何 与 清单 4.1 关联 起 来 呢 ? 嗯 ， 你 可 以 从 那里 提取 push () 以 
wait and pop () 的 代码 ， 如 清单 4.4 所 示 。 


清单 4.4 ， 从 清单 4.1 中 提取 push() 和 wait and pop() 


#include «queue» 
#include <mutex> 
#include <condition_variable> 


template<typename T> 
class threadsafe_queue 
{ 
private: 
std: :mutex mut; 
std: :queue<T> data queue; 
std::condition_variable data_cond; 
public: 
void push(T new_value) 


{ 
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std::lock_guard<std: :mutex> 1k (mut) ; 
data queue.push(new value); 
data cond.notify one(); 


) 


void wait and pop(T& value) 


( 
std::unique lock«std::mutex» 1k(mut) ; 
data cond.wait (1k, [this] {return idata queue.empty 0 ;]) ; 
value-data queue.front(); 
data queue.pop(); 


hi 
threadsafe_queue<data_chunk> data_queue; 0 


void data preparation thread() 


{ 


while(more data to prepare()) 


{ 


data_chunk const data-prepare data(); 
data queue.push(data); -© 


} 


void data processing thread() 


{ 


while (true) 


{ 


data_chunk data; 
data queue.wait and pop (data); «e 
process (data); 
if(is last chunk (data) ) 
break; 


) 


互 斥 元 和 条 件 变量 现在 包含 在 chreadsafe queue 的 实例 中 , 所 以 不 再 需要 单独 
的 变量 @， 并 且 调 用 push () 不 再 需要 外 部 的 同步 @。 此 外 ，wait_and_Pop () 负 责 
条 件 变量 等 待 @。 

wait and pop () 的 另 一 个 重 载 现在 很 容易 编写 , 其 余 的 函数 几乎 可 以 一 字 不 差 地 
从 清单 3.5 中 的 栈 示例 中 复制 过 来 。 清 单 4.5 展示 了 最 终 的 队列 实现 。 


清单 4.5 使 用 条 件 变量 的 线程 安全 队列 的 完整 类 定义 


#include «queue» 
#include «memory» 
#include <mutex> 
#include <condition_variable> 


template<typename T> 
class threadsafe_queue 
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+ B 互 斥 元 必须 是 
mutable std::mutex mut; 可 变 的 
std::queue<T> data queue; 

Std::condition variable data cond; 

public: 

threadsafe queue() 


{} 


threadsafe queue(threadsafe queue const& other) 
{ 
std: :lock_guard<std::mutex> 1k(other.mut) ; 
data_queue=other.data_queue; 


} 


void push(T new_value) 

{ 
std: :lock_guard<std::mutex> lk (mut); 
data queue.push(new value); 
data cond.notify one(); 


) 


void wait and pop(T& value) 
{ 
Std::unique lock«std::mutex» lk (mut); 
data cond.wait (1k, [this] {return !data queue.empty() ;)) ; 
value-data queue.front(); 
data queue.pop(); 


Std::shared ptr«T» wait and pop() 


std: :unique lock«std::mutex» lk (mut); 
data cond.wait(lk, [this] {return !data queue.empty();]); 
Std::shared ptr«T» res(std::make shared«T» (data queue.front())); 
data queue.pop(); 
return res; 
) 
bool try. pop(T& value) 
{ 
std::lock_guard<std::mutex> lk (mut); 
if (data_queue.empty () ) 
return false; 
value=data_queue.front () ; 
data queue.pop(); 
xzeturn. true; 


Std::shared ptr«T» try pop() 


Std::lock guard«std::mutex» lk (mut); 
if (data queue.empty () ) 
return std::shared ptr«T»(); 
Std::shared ptr«T» res(std::make shared«T» (data queue.front())); 
data queue.pop(); 


4.2 


4.2 使 用 future 等待 一 次 性 事件 7A 


return res; 


) 


bool empty() const 


std::lock guard«std::mutex» lk (mut) ; 
return data queue.empty(); 

m 

虽然 empty() 是 一 个 const 成 员 函 数 ， 并 且 拷 贝 构 造 函 数 的 other 参数 是 一 个 
const 引用 ， 但 是 其 他 线程 可 能 会 有 到 该 对 象 的 非 const 引用 ， 并 调用 可 变 的 成 员 函 
数 ， 所 以 我 们 仍然 需要 锁定 互 斥 元 。 由 于 锁定 互 斥 元 是 一 种 可 变 的 操作 ， 故 互 斥 元 对 象 
必须 标记 为 mutable@， 以 便 其 可 以 被 锁定 在 empty O 和 拷贝 构造 函数 中 。 

条 件 变量 在 多 个 线程 等 待 同 一 个 事件 的 场合 也 是 很 有 用 的 。 如 果 线 程 被 用 于 划分 工 
作 负 载 ， 那 么 应 该 只 有 一 个 线程 去 响应 通知 ， 可 以 使 用 与 清单 4.1 中 所 示 完 全 相同 的 结 
构 ， 只 要 运行 多 个 数据 处 理 线程 的 实例 。 当 新 的 数据 准备 就 绪 ，notify_one O 的 调用 
将 触发 其 中 一 个 正在 执行 wait O 的 线程 去 检查 其 条 件 ， 然 后 从 wait () 返回 (因为 你 
刚 向 data queue 中 增加 了 一 项 ) 。 谁 也 不 能 保证 哪个 线程 会 被 通知 到 ， 即 使 是 某 个 线 
程 正 在 等 待 通知 ， 所 有 的 处 理 线程 可 能 仍 在 处 理 数据 。 

另 一 种 可 能 性 是 ， 多 个 线程 正 等 待 着 同一 个 事件 ， 并 且 它们 都 需要 作出 响应 。 这 可 
能 发 生 在 共享 数据 正在 初始 化 的 场合 下 ， 处 理 线程 都 可 以 使 用 同一 个 数据 ,但 需要 等 竺 
其 初始 化 完成 (虽然 有 比 这 更 好 的 机 制 ， 参见 第 3 章 中 的 3.3.1 节 )， 或 者 是 线程 需要 等 . 
待 共享 数据 更 新 的 地 方 ， 比 如 周期 性 的 重新 初始 化 。 在 这 些 案例 中 ， 准 备 数据 的 线程 可 
以 在 条 件 变量 上 调用 notify all O 成 员 函 数 而 不 是 notify_one () 。 顾 名 思 义 ， 这 
将 导致 所 有 当前 执行 着 wait () 的 线程 检查 其 等 待 中 的 条 件 。 

如 果 等 待 线程 只 打算 等 待 一 次 ， 那 么 当 条 件 为 +rue 时 它 就 不 会 再 等 待 这 个 条 件 变 
量 了 ， 条 件 变量 未 必 是 同步 机 制 的 最 佳 选择 。 如 果 所 等 待 的 条 件 是 一 个 特定 数据 块 的 可 
用 性 时 ， 这 尤其 正确 。 在 这 个 场景 中 ， 使 用 期 值 (future) 可 能 会 更 合适 。 


使 用 future 等 待 一 次 性 事件 


假设 你 要 乘 飞机 去 国外 度假 。 在 到 达 机 场 并 且 完 成 了 各 种 值 机 手续 后 ， 你 仍然 需要 
等 待 航班 准备 登 机 的 通知 ， 也 许 要 几 个 小 时 。 当 然 ， 你 可 以 找到 一 些 方法 来 消磨 时 间 ， 
比如 看 书 、 上 网 或 者 在 昂贵 的 机 场 咖 啡 厅 吃 东西 ， 但 是 从 根本 上 来 说 ， 你 只 是 在 等 待 一 
件 事情 ; 登 机 时 间 到 了 的 信和 号。 不 仅 如 此 ， 一 个 给 定 的 航班 只 进行 一 次 ， 你 下 次 去 度假 
的 时 候 ， 就 会 等 待 不 同 的 航班 。 

C++ 标准 库 使 用 future 为 这 类 一 次 性 事件 建 模 。 如 果 一 个 线程 需要 等 待 特定 的 一 次 
性 事件 ， 那 么 它 就 会 获取 一 个 future 来 代表 这 一 事件 。 然 后 ， 该 线程 可 以 周期 性 地 在 这 
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个 future 上 等 待 一 小 段 时 间 以 检查 事件 是 否 发 生 (检查 出 发 告示 板 )， 而 在 检查 间隙 执 
行 其 他 的 任务 (在 高 价 咖啡 厅 吃 东西 )。 另 外 ， 它 还 可 以 去 做 另外 一 个 任务 ， 直 到 其 所 
需 的 事件 已 发 生 才 继续 进行 ， 随 后 就 等 待 future BARA (ready), future 可 能 会 有 与 
之 相关 的 数据 (比如 你 的 航班 在 哪个 登 机 口 登 机 ), 或 可 能 没有 。 一 旦 事件 已 经 发 生 (B 
future 已 变 为 就 绪 ) ，future 就 无 法 复位 。 

C++ 标 准 库 中 有 两 类 future， 是 由 <future> 库 的 头 文件 中 声明 的 两 个 类 模板 实现 的 ， 唯 
— future (unique futures, std: :future<>) 和 共享 future (shared futures, std: : shared 
future<>)。 这 两 个 类 模板 是 参照 std::unique ptr 和 std::shared ptr 建立 的 。 
std: :future 的 实例 是 仅 有 的 一 个 指向 其 关联 事件 的 实例 ,而 多 个 std: : shareq future 
的 实例 则 可 以 指向 同一 个 事件 。 对 后 者 而 言 ， 所 有 实例 将 同时 变 为 就 绪 ， 并 且 它 们 都 可 以 访 
问 所 有 与 该 事件 相关 联 的 数据 。 这 些 关 联 的 数据 ， 就 是 这 两 种 future 成 为 模板 的 原因 ， 像 
std::unique ptr 和 std::shared ptr 一样 ， 模 板 参 数 就 是 关联 数据 的 类 型 。 
std: future<void>, std: ;shared_future<void> 模 板 特 化 应 该 用 于 无 关联 数据 的 
We. BA future 被 用 于 线程 间 通 信 ， 但 是 future 对 象 本 身 却 并 不 提供 同步 访问 。 如 果 多 
个 线程 需要 访问 同一 个 future 对 象 ， 它 们 必须 通过 互 斥 元 或 其 他 同步 机 制 来 保护 访问 ， 如 
第 3 章 中 所 述 。 然 而 ， 正 如 你 将 在 4.2.5 节 中 看 到 的 ， 多 个 线程 可 以 分 别 访问 自己 的 
std::shared _ future<> 副 本 而 无 需 进 一 步 的 同步 ， 即 使 它们 都 指向 同一 个 异步 结果 。 

最 基本 的 一 次 性 事件 是 在 后 台 运 行 着 的 计算 结果 。 早 在 第 2 章 中 你 就 看 到 过 
std: : thread 并 没有 提供 一 种 简单 的 从 这 一 任务 中 返回 值 的 方法 ， 我 保证 这 将 在 第 4 
章 中 通过 使 用 future 加 以 解决 一 一 现在 是 时 候 去 看 看 如 何 做 了 。 


4.2.1 从 后 台 任务 中 返回 值 


假设 你 有 一 个 长 期 运行 的 计算 ， 预 期 最 终 将 得 到 一 个 有 用 的 结果 ， 但 是 现在 ， 你 还 
不 需要 这 个 值 。 也 许 你 已 经 找到 一 种 方法 来 确定 生命 、 字 宙 及 万 物 的 答案 ， 这 是 从 
Douglas Adams' 那 里 偷 来 的 一 个 例子 。 你 可 以 启动 一 个 新 的 线程 来 执行 该 计算 ， 但 这 也 
意味 着 你 必须 注意 将 结果 传 回 来 ， 因 为 std::thread 并 没有 提供 直接 的 机 制 来 这 样 
做 。 这 就 是 std: :async 函数 模板 (同样 声明 于 <future> 头 文件 中 ) 的 由 来 。 

在 不 需要 立刻 得 到 结果 的 时 候 ， 你 可 以 使 用 std::async 来 启动 一 个 异步 任务 
(asynchronous task), std::async 返回 一 个 std: :future 对 象 ， 而 不 是 给 你 一 个 
std::thread 对 象 让 你 在 上 面 等 待 ，std: :future 对 象 最 终 将 持 有 函数 的 返回 值 。 
当 你 需要 这 个 值 时 ， 只 要 在 future 上 调用 get () ， 线 程 就 会 阻塞 直到 future MH, A 
返回 该 值 。 清 单 4.6 展示 了 一 个 简单 的 例子 。 


! dE The Hitchhiker s Guide to the Galaxy 一 书 中 ， 计 算 机 Deep Thought 被 建造 是 用 于 决定 “生命 、 
宇宙 和 万 物 的 答案 "。 答 案 是 42。 
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清单 4.6 使 用 std::future 获取 异步 任务 的 返回 值 


#include <future> 
#include <iostream> 


int find the answer to ltuae(); 
void do other stuff(); 
int main() 


{ 


std: :future<int> the answer-std::async(find the answer to ltuae); 
do other stuff (); 
std::cout<<"The answer is "««the answer .get()««std::endl; 


std: :async 允许 你 通过 将 额外 的 参数 添加 到 调用 中 ， 来 将 附加 参数 传递 给 函数 ， 
这 与 std: :thread 是 同样 的 方式 。 如 果 第 一 个 参数 是 指向 成 员 函 数 的 指针 ， 第 二 个 参 
数 则 提供 了 用 来 应 用 该 成 员 函 数 的 对 象 (直接 地 ， 或 通过 指针 ， 或 封装 在 std: :ref 
中 )， 其 余 的 参数 则 作为 参数 传递 给 该 成 员 函 数 。 否 则 ， 第 二 个 及 后 续 的 参数 将 作为 参 
数 ， 传 递 给 第 一 个 参数 所 指定 的 函数 或 可 调用 对 象 。 和 std: :thread 一 样 ， 如 果 参 数 
是 右 值 ， 则 通过 移动 原来 的 参数 来 创建 副本 。 这 就 允许 使 用 只 可 移动 的 类 型 同时 作为 函 
数 对 象 和 参数 。 请 看 清单 4.7。 


清单 4.7 使 用 std::async 来 将 参数 传递 给 函数 


#include <string> 
#include <future> 


struct X 


( 


void foo(int,std::string const&); 
std::string bar(std::string const&); 


i! 调用 p->foo(42,"hello"), 
PET " 其 中 p 是 &x 
auto fl-std::async(&X::foo, &x, 42, "hello"); 
auto f2-std::async(&X: :bar,x, "goodbye") ; 
struct Y a 调用 tmpx.bar("goodbye"), 其 
中 tmpx 是 x 的 副本 
double operator() (double); 
i 调用 tmpy(3.140)， 其 中 tmpy 
Y yi 是 从 YO 移动 构造 的 
auto f3-std::async(Y(),3.141); 


auto f4-std::async (std: :ref (y) ,2.718) ; X 调用 y(2.718) 
X baz(X&); 
std: :async (baz, std: :ref (x)) ; RE 调用 baz(x) 
class move_only 
{ 
public: 
move only(); 
move only (move only&&) 
move only (move only const&) - delete; 
move only& operators (move only&&); 
move only& operator- (move only const&) = delete; 
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构造 的 


void operator() (); M 调用 tmp0， 其 中 tmp 是 从 std::move(move_only()) 


auto f£5=std::async(move_only()) ; 


默认 情况 下 ，std: :async 是 否 启 动 一 个 新 线程 ， 或 者 在 等 待 future 时 任务 是 否 同步 
运行 都 取决 于 具体 实现 方式 。 在 大 多 数 情况 下 这 就 是 你 所 想 要 的 ， 但 你 可 以 在 函数 调用 之 
前 使 用 一 个 额外 的 参数 来 指定 究竟 使 用 何 种 方式 。 这 个 参数 为 std::launch 类 型 ， 可 以 
Æ std: : launch: :deferred, 以 表明 该 函数 调用 将 会 延迟 ,直到 在 future 上 调用 wait () 
或 get () 为 止 ， 或 者 是 std: :1aunch: :async， 以 表明 该 函数 必须 运行 在 它 自己 的 线程 
上 ， 又 或 者 是 std::launch::deferred | std::launch: :async， 以 表明 可 以 由 具 
体 实 现 来 选择 。 最 后 一 个 选项 是 默认 的 。 如 果 函 数 调用 被 延迟 ， 它 有 可 能 永远 都 不 会 实际 
运行 。 例 如 ， 


auto f6-std::async(std::launch::async,Y(),1.2); «— 在 新 线程 中 运行 

auto f7-std::async(std::launch::deferred,baz,stád::ref(x)); XE wait0 或 get 

auto f8-std::async( < 一 TM 
Std::launch::deferred | std::launch::async, 由 具体 实现 来 中 运行 


baz,std::ref(x)); 
auto f9-std::async(baz,std::ref(x)); 


£7.wait (); < 调用 延迟 了 的 函数 

正如 你 稍 后 将 在 本 章 看 到 ， 并 将 在 第 8 章 中 再 次 看 到 的 那样 ， 使 用 std: :async 
能 够 轻易 地 将 算法 转化 成 可 以 并 行 运 行 的 任务 。 然 而 ， 这 并 不 是 将 std: : future 与 
任务 相关 联 的 唯一 方式 ， 你 还 可 以 通过 将 任务 封装 在 std: :packaged task<> 类 模 
板 的 一 个 实例 中 ， 或 者 通过 编写 代码 ， 用 std: :promi se<> 类 模板 显 式 设置 值 等 方 
式 来 实现 。std: :packaged task 是 比 std::promise 更 高 层次 的 抽象 ， 所 以 我 
将 从 它 开 始 。 


4.2.2 将 任务 与 future 相关 联 


std::packaged task<> 将 一 个 future 绑 定 到 一 个 函数 或 可 调用 对 象 上 。 当 
std::packaged task<> 对 象 被 调用 时 ， 它 就 调用 相关 联 的 函数 或 可 调用 对 象 ， 并 且 
让 future 就 绪 , 将 返回 值 作为 关联 数据 储存 。 这 可 以 被 用 作 线程 池 的 构件 (参见 第 9 BE) , 
或 者 其 他 任务 管理 模式 ， 例 如 在 每 个 任务 自己 的 线程 上 运行 ， 或 在 一 个 特定 的 后 台 线程 
上 按 顺 序 运行 所 有 任务 。 如 果 一 个 大 型 操作 可 以 分 成 许多 自 包含 的 子 任务 ， 其 中 每 一 个 
都 可 以 被 封装 在 一 个 std: :packaged task<> 实 例 中 , 然后 将 该 实例 传 给 任务 调度 器 
或 线程 池 。 这 样 就 抽象 出 了 任务 的 详细 信息 ， 调 度 程序 仅 需 处 理 std: :packaged_ 
task<> 实 例 ， 而 非 各 个 函数 。 

std::packaged task<> 类 模板 的 模板 参数 为 函数 签名 ， 比 如 void 0 表示 无 参 
数 无 返回 值 的 函数 ， 或 是 像 int(std::strings,double*) 表示 接 受 对 stá:: 
string 的 非 const 引用 和 指向 double 的 指针 ， 并 返回 int 的 函数 。 当 你 构造 
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std::packaged task 实例 的 时 候 ， 你 必须 传人 一 个 函数 或 可 调用 对 象 ， 它 可 以 接受 
指定 的 参数 并 且 返 回 指定 的 返回 类 型 。 类 型 无 需 严格 匹配 ， 你 可 以 用 一 个 接受 int 并 返 
回 float 的 函数 构造 std: :packaged_task<double (double) >, 因为 这 些 类 型 是 
可 以 隐 式 转换 的 。 

指定 的 函数 签名 的 返回 类 型 确定 了 从 gec future O 成 员 函 数 返回 的 std:: 
future<> 的 类 型 ,而 函数 签名 的 参数 列表 用 来 指定 封装 任务 的 函数 调用 运算 符 的 签名 。 
例如 ，std: :packaged task<std: :string(std::vector<char>*, int) > 的 部 


分 类 定义 如 清单 4.8 所 示 。 


清单 4.8 std:packaged task<> 特 化 的 部 分 类 定义 


template«» 
class packaged task«std::string(std::vector«char»*,int)» 


{ 

public: 
template<typename Callable> 
explicit packaged_task (Callable&& £): 
std::future«std::string» get future(); 
void operator () (std::vector«char»*,int); 


n 

该 std::packaged task 对 象 是 一 个 可 调用 对 象 ， 它 可 以 被 封装 人 一 个 
std::function 对 象 ， 作 为 线程 函数 传 给 std: : thread, 或 传 给 需要 可 调用 对 象 的 
另 一 个 函数 ， 或 者 干脆 直接 调用 。 当 std::packaged task 作为 函数 对 象 被 调用 时 ， 
提供 给 函数 调用 运算 符 的 参数 被 传 给 所 包含 的 函数 ， 并 且 将 返回 值 作 为 异步 结果 ， 存储 
在 由 get_future() 获取 的 std::future 中 。 因 此 ， 你 可 以 将 任务 封装 在 
std::packaged task 中 , 并 且 在 把 std: :packaged task 对 象 传 到 别 的 地 方 进 行 
适当 调用 之 前 获取 future。 当 你 需要 结果 时 ， 你 可 以 等 待 future 变 为 就 绪 ， 清单 4.9 的 例 
子 实际 展示 了 这 一 点 。 


在 线程 之 间 传 递 任务 


许多 GUI 框架 要 求 从 特定 的 线程 来 完成 GUI 的 更 新 ， 所以， 如 果 另 一 个 线程 需 
要 更 新 GUI, 它 必须 向 正确 的 线程 发 送 消息 来 实现 这 一 点 。std: :packaged_ task 
提供 了 一 种 更 新 GUI 的 方法 ， 该 方法 无 需 为 每 个 与 GUI 相关 的 活动 获取 自 定义 的 
消息 。 


清单 4.9 使 用 std::packaged task 在 GUI 线程 上 运行 代码 


#include «deque» 
#include <mutex> 
#include <future> 
#include <thread> 
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#include «utility» 


Std::mutex m; 
std: :deque<std: :packaged_task<void()> > tasks; 


bool gui shutdown message received(); 
void get and process gui message(); 


void gui thread() «9 


while(!gui shutdown message received()) 


get and process gui message(); 
Std::packaged task«void()» task; 
{ 
Std::lock guard«std::mutex» 1k(m) ; 
if (tasks.empty ()) 
continue; 
task=std: :move (tasks.front()); 
tasks.pop front(); 


oe ee 


} 
task0; <+@ 
} 
} 


std::thread gui bg thread(gui thread); 


template«typename Func> 
std::future<void> post task for gui thread(Func f) 


( 


std: :packaged_task<void()> task(£f); +@ 
std::future<void> res-task.get future(); 0O 
std: :lock_guard<std: :mutex> lk (m); 

tasks.push back (std: :move (task) ) ; -© 


return res; 


此 代码 非常 简单 : GUI 线程 @ 循环 直到 收 到 通知 GUI 停止 的 消息 @@， 反 复 轮 询 待 
处 理 的 GUI 消息 目 ， 比 如 用 户 点 击 ， 以 及 任务 队列 中 的 任务 。 如 果 队 列 中 没有 任务 O, 
则 再 次 循环 否则， 从 任务 队列 中 提取 任务 0, 解除 队列 中 的 锁 ， 并 运行 任务 @。 当 任 
务 完成 时 ， 与 该 任务 相关 联 的 future 被 设 为 就 绪 。 

在 队列 上 发 布 任务 也 同样 简单 : 利用 所 提供 的 函数 创建 一 个 新 的 任务 包 @， 通 过 调 
用 get future () 成 员 函 数 从 任务 中 获取 future@， 同 时 在 返回 future 到 调用 处 之 前 @ 
将 任务 置 于 列表 之 上 @。 发 出 消息 给 GUI 线程 的 代码 如 果 需 要 知道 任务 已 完成 , 则 可 以 
等 待 该 future， 若 无 需 知道 ， 则 可 以 丢弃 该 future, 

本 示例 中 的 任务 使 用 std:packaged_task<void() >, 它 封 装 了 一 个 接受 零 参数 
且 返 回 void 的 函数 或 可 调用 对 象 (如果 它 返 回 了 别 的 东西 ， 则 返回 值 被 丢弃 )。 这 是 
最 简单 的 任务 ， 但 如 你 在 前 面 所 看 到 的 ，stq:packaged task 也 可 以 用 于 更 复杂 的 
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情况 一 通过 指定 一 个 不 同 的 函数 签名 作为 模板 参数 ， 你 可 以 改变 返回 类 型 (以 及 在 
future 的 关联 状态 中 存储 的 数据 类 型 ) 和 函数 调用 运算 符 的 参数 类 型 。 这 个 示例 可 以 进 
行 简单 的 扩展 ， 让 那些 在 GUI 线程 上 运行 的 任务 接受 参数 ， 并 且 返 回 std: :future 
中 的 值 ， 而 不 是 仅 一 个 完成 指示 符 。 

那些 无 法 用 一 个 简单 函数 调用 表达 的 任务 和 那些 结果 可 能 来 自 不 止 一 个 地 方 的 任 
务 又 当 如 何 ? 这些 情况 都 可 以 通过 第 三 种 创建 future 的 方式 来 处 理 : 使 用 
std::promise 来 显 式 地 设置 值 。 


4.2.3 生成 (std::)promise 


当 有 一 个 需要 处 理 大 量 网 络 连 接 的 应 用 程序 时 , 通常 倾向 于 在 独立 的 线程 上 分 
别处 理 每 个 连接 ， 因 为 这 能 使 得 网 络 通 信 更 易于 理解 也 更 易于 编程 。 这 对 于 较 低 的 
连接 数 (因而 线程 数 也 较 低 ) 效果 很 好 。 然 而 ， 随 着 连接 数 的 增加 ， 这 就 变 得 不 那 
ABET: 大 量 的 线程 就 会 消耗 大 量 操作 系统 资源 ， 并 可 能 导致 大 量 的 上 下 文 切 换 
( 当 线 程 数 超过 了 可 用 的 硬件 并 发 )， 进 而 影响 性 能 。 在 极端 情况 下 ， 操 作 系统 可 能 
会 在 其 网 络 连 接 能 力 用 尽 之 前 ， 就 为 运行 新 的 线程 而 耗 尽 资源 。 在 具有 超大 量 网 络 
连接 的 应 用 程序 中 ,通常 用 少量 线程 (可 能 仅 有 一 个 ) 来 处 理 连 接 ， 每 个 线程 一 次 
处 理 多 个 连接 。 

考虑 其 中 一 个 处 理 这 种 连接 的 线程 。 数 据 包 将 以 基本 上 随机 的 顺序 来 自 于 待 处 
理 的 各 个 连接 ， 同 样 地 ， 数 据 包 将 以 随机 顺序 进行 排队 发 送 。 在 多 数 情况 下 ， 应 用 
程序 的 其 他 部 分 将 通过 特定 的 网 络 连接 ， 等 待 着 数据 被 成 功 地 发 送 或 是 新 一 批 数据 
被 成 功 地 接收 。 

std: :promise<T> 提 供 一 种 设置 值 (类 型 了 ) 方式 , 它 可 以 在 这 之 后 通过 相关 联 
的 std: :future<T> 对 象 进行 读 取 , 一 对 std: :promise/std: :future 为 这 一 设施 
提供 了 一 个 可 能 的 机 制 ， 等 待 中 的 线程 可 以 阻塞 future, 同时 提供 数据 的 线程 可 以 使 用 
配对 中 的 promise 项 ， 来 设置 相关 的 值 并 使 future 就 绪 。 

你 可 以 通过 调用 get. future () 成 员 函 数 来 获取 与 给 定 的 std: : promise 相关 的 
std::future 对 象 ; 比如 std::packaged task。 当 设置 完 promise 的 值 (使 用 
set value () 成 员 函 数 ) future 会 变 为 就 绕 ， 并 且 可 以 用 来 获取 所 存储 的 数值 。 如 果 
销毁 std: :promise 时 未 设置 值 ， 则 将 存 入 一 个 异常 。4.2.4 节 描 述 了 异常 是 如 何 跨 线 
程 转移 的 。 

清单 4.10 展示 了 处 理 如 前 文 所 述 的 连接 的 示例 代码 。 在 这 个 例子 中 ， 使 用 一 对 
std: :promise<bool>/std: : future<boo1> 对 来 标识 一 块 传 出 数据 的 成 功 传输 ;与 
future 关联 的 值 就 是 一 个 简单 的 成 功 /失败 标志 。 对 于 传人 的 数据 包 ， 与 future 关联 的 数 
据 为 数据 包 的 负载 。 
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清单 4.10 使 用 promise 在 单个 线程 中 处 理 多 个 连接 


#include «future» 


void process connections (connection set& connections) 


{ 


while(!done(connections)) +@ 


{ 
for (connection_iterator .9 
connection-connections.begin(),endsconnections.end(); 
connection!-end; 
*-connection) 


if(connection-»has incoming data()) <+@ 
{ 


data packet data=connection->incoming() ; 
Std::promise«payload type»& p= 

connection-»get promise (data.id) ; 0 
p.set_value (data.payload) ; 


} 


if(connection-»has outgoing data()) -© 


outgoing packet data= 
connection-»top of outgoing queue(); 
connection-»send (data.payload); 
data.promise.set value (true); +@ 
} 
} 
} 


函数 process_connections () 一 直 循 环 到 done () 返回 true@。 每 次 循环 中 ， 
轮流 检查 每 个 连接 @， 在 有 传人 数据 时 获取 之 © 或 是 发 送 队 列 中 的 传 出 数据 @。 此 处 
假定 一 个 输入 数据 包 具 有 ID 和 包含 实际 数据 在 内 的 负载 。 此 ID 被 映射 至 
std::promise (可 能 是 通过 在 关联 容器 中 进行 查找 ) @， 并 且 该 值 被 设 为 数据 包 的 人 负 
载 。 对 于 传 出 的 数据 包 ， 数据 包 取 自传 出 队列 ， 并 实际 上 通过 此 连接 发 送 。 一 旦 发 送 完 
毕 ,与 传 出 数据 关联 的 promise 被 设 为 true 以 表示 传输 成 功 @。 此 映射 对 于 实际 网 络 
协议 是 否 完好 ， 取 决 于 协议 本 身 ， 这 种 promise/future 风格 的 结构 可 能 并 不 适用 于 某 特 
定 情况 ， 尽 管 它 确 实 与 某 些 操作 系统 支持 的 异步 VO 具有 相似 的 结构 。 

迄今 为 止 的 所 有 代码 完全 忽略 了 异常 。 虽 然 想 象 一 个 万 物 都 始终 运转 良好 的 世界 
是 美好 的 ， 但 却 不 切实 际 。 有 时 候 磁 盘 装 满 了 ， 有 时 候 你 要 找 的 东西 恰好 不 在 那里 ， 
有 时 候 网 络 故障 ， 有 时 数据 库 损 坏 。 如 果 你 正在 需要 结果 的 线程 中 执行 操作 ， 代 码 可 
能 只 是 用 异常 报告 了 一 个 错误 ， 因 此 仅仅 因为 你 想 用 std::packaged task 或 
std::promise, 就 限制 性 地 要 求 所 有 事情 都 正常 工作 是 不 必要 的 。 因 此 C++ 标准 库 
提供 一 个 简便 的 方式 ， 来 处 理 这 种 场景 下 的 异常 ， 并 允许 他 们 作为 相关 结果 的 一 部 分 
而 保存 。 
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42.4 为 future 保存 异常 


考 率 下 面 简短 的 代码 片段 。 如 果 将 -1 传人 square root () 函数 ， 会 引发 一 个 腊 
常 ， 同 时 将 被 调用 者 所 看 到 。 


double square root (double x) 
if (x«0) 


throw std::out of range ("x«0"); 


) 


return sqrt (X); 


} 
现在 假设 不 是 仅 从 当前 线程 调用 square root 0 : 
double yssquare root(-1); 


而 是 以 异步 调用 的 形式 运行 调用 : 


std: :future<double> f-std::async(square root,-1); 
double ysf.get(); 


两 者 行为 完全 一 致 自然 是 最 理想 的 ， 与 y 得 到 函数 调用 的 任意 一 种 结果 一 样 ， 
如 果 调 用 £.get O 的 线程 能 像 在 单线 程 情况 下 一 样 ， 能 够 看 到 里 面 的 异常 ， 那 是 极 
好 的 。 

实际 情况 则 是 ， 如 果 作为 std: :async 一 部 分 的 函数 调用 引发 了 异常 ， 该 异常 会 
被 储存 在 future 中 ， 代 蔡 所 存储 的 值 ，future 变 为 就 绪 ， 并 且 对 get O 的 调用 会 重新 引 
发 所 存储 的 异常 QE. 重新 引发 的 是 原始 异常 对 象 抑或 其 副本 ，C++ 标 准 并 没有 指定 ， 
不 同 的 编译 器 和 库 在 此 问题 上 作出 了 不 同 的 选择 ) 。 这 同样 发 生 在 将 函数 封装 人 
std::packaged task 的 时 候 一 一 当 任务 被 调用 时 ， 如 果 封 装 的 函数 引发 异常 ， 该 异 
常 代替 结果 存 人 fnture， 准 备 在 调用 get O 时 引发 。 

顺理成章 ，std: :promise 在 显 式 地 函数 调用 下 提供 相同 的 功能 。 如 果 期 望 存储 
一 个 异常 而 不 是 一 个 值 ， 则 调用 set exception O 成 员 函 数 而 不 是 set_value(). 
这 通常 是 在 引发 异常 作为 算法 的 一 部 分 时 用 在 catch 块 中 ， 将 该 异常 填 人 promise. 
extern std::promise<double> some_promise; 


try 


{ 


Some promise.set value(calculate value()); 


) 


vato 


{ 


some_promise.set_exception(std::current_exception()); 


} 
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这 里 使 用 std: : current_exception() 来 获取 已 引发 的 异常 。 作 为 替代 ， 可 以 
使 用 std::copy exception () 直 接 存 储 新 的 异常 而 不 对 引发 。 


Some promise.set exception(std::copy exception(std: niagüicierror("£eo-'))); 


在 异常 的 类 型 已 知 时 ， 这 上 比 使 用 try/catch 块 更 为 简洁 ， 并 且 应 该 优先 使 用 ， 这 
不 仅仅 简化 了 代码 ， 也 为 编译 器 提供 更 多 的 优化 代码 的 机 会 。 

另 一 种 将 异常 存储 至 future 的 方式 ， 是 销毁 与 future 关联 的 std::promise 或 
std: :packaged task， 而 无 需 在 promise 上 调用 设置 函数 或 是 调用 打包 任务 。 在 任何 一 
种 情况 下 ， 如 果 future MARL, std: :promise 或 std: :packaged task 的 析 构 函数 
会 将 具有 std::future errc::broken promise 错误 代码 的 std::future error 
异常 存储 在 相关 联 的 状态 中 。 通 过 创建 future， 你 承诺 提供 一 个 值 或 异常 ， 而 通过 销毁 该 值 
或 异常 的 来 源 ， 你 违背 了 承诺 。 在 这 种 情况 下 如 果 编 译 器 没有 将 任何 东西 存 进 future， 等 待 
中 的 线程 可 能 会 永远 等 下 去 。 

到 目前 为 止 ， 所 有 的 例子 都 使 用 了 std::future, Af, std::future 有 其 局 
限 性 ， 最 起 码 ， 只 有 一 个 线程 能 等 待 结 果 。 如 果 需 要 多 于 一 个 的 线程 等 待 同一 个 事件 ， 
则 需要 使 用 std::shared future 来 代替 。 


4.2.5 等待 自 多 个 线程 


尽管 std::future 能 处 理 从 一 个 线程 向 另 一 线程 转移 数据 所 需 的 全 部 必要 的 同 
步 , 但 是 调用 某 个 特定 的 std: : future 实例 的 成 员 函 数 却 并 没有 相互 同步 。 如 果 从 多 
个 线程 访问 单个 std: : future 对 象 而 不 进行 额外 的 同步 ,就 会 出 现 数据 竞争 和 未 定义 
行为 。 这 是 有 意 为 之 的 ，std: : future 模型 统一 了 异步 结果 的 所 有 权 ， 同 时 get O 的 
单 发 性 质 使 得 这 样 的 并 发 访问 没有 意义 一 一 只 有 一 个 线程 可 以 获取 值 ， 因 为 在 首次 调用 
get () 后 ， 就 没有 任何 可 获取 的 值 留 下 了 。 

如 果 你 的 并 发 代码 的 绝妙 设计 要 求 多 个 线程 能 够 等 待 同 一 个 事件 ， 目 前 还 无 需 
失去 信心 ;， std::shared future 完全 能 够 实现 这 一 点 。 鉴 于 std::future 是 
仅 可 移动 的 ， 所 以 所 有 权 可 以 在 实例 间 转 移 ， 但 是 一 次 只 有 一 个 实例 指向 特定 的 蜡 
步 结 果 。std: :shared_future 实例 是 可 复制 的 ， 因 此 可 以 有 多 个 对 象 引用 同一 
个 相关 状态 。 

现在 ， 即 便 有 了 std: :shareq_future， 各 个 对 象 的 成 员 函 数 仍然 是 不 同步 的 ， 
所 以 为 了 避免 从 多 个 线程 访问 单个 对 象 时 出 现 数据 竞争 ， 必 须 使 用 锁 来 保护 访问 。 首 选 
的 使 用 方式 ， 是 用 一 个 对 象 的 副本 来 代替 ， 并 且 让 每 个 线程 访问 自己 的 副本 。 从 多 个 线 
程 访 问 共享 的 异步 状态 , 如 果 每 个 线程 都 是 通过 自己 的 std: :shared future 对 象 去 
访问 该 状态 ， 那 么 就 是 安全 的 ， 见 图 4.1。 
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线程 1 线程 2 
在 st 上 未 同步 的 
数据 竞争 


共享 变量 sf 


std::shared future<int> 


sf.wait() sf.wait( 


线程 1 线程 2 


复制 是 安全 的 
x N auto local=sf; 


共享 变量 sf 
td::shared future«in 


引用 异步 | 结果 ing "s 
oc 
引用 


独立 的 对 象 eon .wait() 
所 以 没有 数据 竞争 ”| | 
图 4.1 使 用 多 个 std::shared_future 对 象 避 免 数据 竞争 


std::shared future 的 一 个 潜在 用 处 ， 是 实现 类 似 复杂 电子 表格 的 并 行 执行 。 
每 个 单元 都 有 一 个 单独 的 终 值 ， 可 以 被 多 个 其 他 单元 格 中 的 公式 使 用 。 用 来 计算 各 个 单 
元 格 结果 的 公式 可 以 使 用 std: :shared_future 来 引用 第 一 个 单元 。 如 果 所 有 独立 单 
元 格 的 公式 被 并 行 执行 ， 那些 可 以 继续 完成 的 任务 可 以 进行 ， 而 那些 依赖 于 其 他 单元 格 
的 公式 将 阻塞 ， 直到 其 依赖 关系 准备 就 绪 。 这 就 使 得 系统 能 最 大 限度 地 利用 可 用 的 硬件 
并 发 。 

引用 了 异步 状态 的 std::shared future 实例 可 以 通过 引用 这 些 状态 的 
std::future 实例 来 构造 。 由 于 std: :future 对 象 不 和 其 他 对 象 共享 异步 状态 的 所 
有 权 ， 因 此 该 所 有 权 必 须 通过 std: :move 转移 到 std::shared future, 将 
std::future 留 在 空 状态 ， 就 像 它 被 默认 构造 了 一 样 。 


std: :promise<int> p; 

std::future<int> f(p.get future()); af future f 是 有 效 的 
assert(f.valid()); 

std::shared_future<int> sf(std::move (£)); 

assert (!£.valid()); O SERÁ 
assert (sf.valid()); -© sf 现在 有 效 


JA, future £ 刚 开 始 是 有 效 的 @， 因 为 它 引用 了 promise p 的 异步 状态 ,但 是 将 状 


auto local=sf; 


local.wait () 
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态 转 移 至 sf 后 ，f 不 再 有 效 @， 而 sf ARO, 

正如 其 他 可 移动 的 对 象 那 样 ， 所 有 权 的 转移 对 于 右 值 是 隐 式 的 ， 因 此 可 以 从 
std::promise 对 象 的 get future () 成 员 函 数 的 返回 值 直接 构造 一 个 std: : shared 
future， 例 如 
std: :promise<std::string> p; 9 所 有 权 的 隐 式 转移 
std::shared_future<std::string> sf(p.get future()); 

此 处 , 所 有 权 的 转移 是 隐 式 的 ，std: :shared future<> 根 据 std: :future<std:: 
string> 类 型 的 右 值 进行 构造 @。 

std::future 具有 一 个 额外 特性 ， 即 从 变量 的 初始 化 自动 推断 变量 类 型 的 功能 ， 
使 得 std::shared future 的 使 用 更 加 方便 (参见 附录 A 中 A.6 节 )。std: :future 
具有 一 个 share () 成 员 函 数 ， 可 以 构造 一 个 新 的 std::shared future， 并且 直 接 
将 所 有 权 转 移 给 它 。 这 可 以 节省 大 量 的 录入 ， 也 使 代码 更 易于 更 改 。 


Std::promise« std::map« SomeIndexType, SomeDataType, SomeComparator, 
SomeAllocator»::iterator» p; 
auto sf-p.get future().share(); 


ZPR F, sf HARRER std: :shared future<std: :map 
«SomeIndexType,SomeDataType,SomeComparator,SomeAllocator»::iter 
ator>。 如 果 比 较 器 或 分 配器 改变 了 ， 仅 需 改变 promise 的 类 型 ，future 的 类 型 将 自动 
更 新 以 匹配 。 

有 些 时 候 ， 你 会 想 要 限制 等 待 事件 的 时 长 ， 无 论 是 因为 某 段 代码 能 够 占用 的 时 间 有 
着 硬性 的 限制 ， 还 是 因为 如 果 事件 不 会 很 快 发 生 ， 线 程 就 可 以 去 做 其 他 有 用 的 工作 。 为 
了 处 理 这 个 功能 ， 许 多 等 待 函数 具有 能 够 指定 超时 的 变量 。 
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前 面 介绍 的 所 有 阻塞 调用 都 会 阻塞 一 个 不 确定 的 时 间 段 , 挂 起 线程 直至 等 待 的 事件 
发 生 。 在 许多 情况 下 这 是 没 问题 的 ， 但 在 某 些 情况 下 你 会 希望 给 等 待 时 间 加 一 个 限制 。 
这 就 使 得 能 够 发 送 某 种 形式 的 “我 还 活着 ”的 消息 给 交互 用 户 或 者 另 一 个 进程 ， 或 是 在 
用 户 已 经 放弃 等 待 并 且 按 下 取消 键 时 ， 干 脆 放 弃 等 待 。 

有 两 类 可 供 指定 的 超时 : 一 为 基于 时 间 段 的 超时 ， 即 等 待 一 个 指定 的 时 间 长 度 ( 例 
如 30ms)， 或 是 绝对 超时 ， 即 等 到 一 个 指定 的 时 间 点 (例如 世界 标准 时 间 2011 年 11 月 
30 H 17:30:15.045987023) ) 。 大 多 数 等 待 函数 提供 处 理 这 两 种 形式 超时 的 变量 , 处 理 基 于 
时 间 有 段 超时 的 变量 具有 for 后 级 ， 而 处 理 绝对 超时 的 变量 具有 until 后 缀 。 

例如 , std::condition variable 具有 两 个 重 载 版 本 的 wait for () 成 员 函 数 
和 两 个 重 载 版 本 的 wait until O RAR, 对 应 于 两 个 重 载 版 本 的 wait () 一 一 一 个 
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重 载 只 是 等 待 到 收 到 信号 ， 或 超时 ， 或 发 生 伪 唤 醒 ， 另 一 个 重 载 在 唤醒 时 检测 所 给 的 断 
言 ， 并 只 在 所 给 的 断言 为 true (以 及 条 件 变量 已 收 到 信号 ) 或 超时 的 情况 下 才 返 回 。 

在 细 看 使 用 超时 的 函数 之 前 ， 让 我 们 从 时 钟 开始 ， 看 一 看 在 C++ 中 是 如 何 指定 
时 间 的 。 


时 钟 


就 CH 标准 库 所 关注 的 而 言 ， 时 钟 是 时 间 信息 的 来 源 。 有 具体 来 说 ， 时 钟 是 提供 以 下 
四 个 不 同 部 分 信息 的 类 。 

m 现在 (now) 时 间 。 

E ”用 来 表示 从 时 钟 获 取 到 的 时 间 值 的 类 型 。 

图 ”时 钟 的 节拍 周期 。 

加 ”时 钟 是 否 以 均匀 的 速率 进行 计时 ， 决 定 其 是 否 为 匀速 (steady〉 时钟。 

时 钟 的 当前 时 间 可 以 通过 调用 该 时 钟 类 的 静态 成 员 函 数 now O 来 获取 。 例 如 ， 
std::chrono::system clock: :now() 返 回 系 统 时 钟 的 当前 时 间 。 对 于 具体 某 个 时 
钟 的 时 间 点 类 型 ， 是 通过 time point 成员 的 typedef 来 指定 的 ， 因此 
some clock: :now () 的 返回 类 型 是 some clock: :time point, 

时 钟 的 节拍 周期 是 由 分 数秒 指定 的 , 它 由 时 钟 的 period 成 员 typedef 给 出 一 一 每 
秒 走 25 拍 的 时 钟 ， 就 具有 std::ratiocl, 25> 的 period, 而 每 2.5 秒 走 一 拍 的 时 钟 
则 具有 std: :ratio<5, 2>% period, 如 果 时 钟 的 节拍 周期 直到 运行 时 方 可 知晓 ,或 
者 可 能 所 给 的 应 用 程序 运行 期 间 可 变 , 则 period 可 以 指定 为 平均 的 节拍 周期 、 最 小 可 
能 的 节拍 周期 , 或 是 编写 类 库 的 人 认为 合适 的 一 个 值 。 在 所 给 的 一 次 程序 的 执行 中 ,无 
法 保证 观察 到 的 节拍 周期 与 该 时 钟 所 指定 的 period 相符。 

如 果 一 个 时 钟 以 均匀 速率 计时 (无 论 该 时 速 是 否 匹 配 period) 且 不 能 被 调整 ， 则 
该 时 钟 被 称 为 匀速 steady) 时 钟 。 如 果 时 钟 是 匀速 的 ， 则 时 钟 类 的 is steady 静态 
数据 成 员 为 上 zue， 反 之 为 false。 通常 情况 下 ，std: :chrono: :System clock 是 
不 匀速 的 ， 因 为 时 钟 可 以 调整 ， 考 虑 到 本 地 时 钟 漂移 ， 这 种 调整 甚至 是 自动 执行 的 。 这 
样 的 调整 可 能 会 引起 调用 now O 所 返回 的 值 ， 比 之 前 调用 now () 所 返回 的 值 更 早 ， 这 
违背 了 均匀 计时 速率 的 要 求 。 如 你 马上 要 看 到 的 那样 ， 匀速 时 钟 对 于 计算 超时 来 说 非常 
重要 ， 因 此 C++ 标准 库 提供 形式 为 std: :chrono: :steady clock 的 匀速 时 钟 。 由 
C++ 标准 库 提 供 的 其 他 时 钟 包括 std::chrono: :system clock (上 文 已 提 到 )， 它 
代表 系统 的 “真实 时 间 ” 时 钟 ， 并 为 时 间 氮 和 time t 值 之 间 的 相互 转换 提供 函数 ， 还 
有 std::chrono: :high resolution clock, 它 提供 所 有 类 库 时 钟 中 最 小 可 能 的 
节拍 周期 (和 可 能 的 最 高 精度 )。 它 实际 上 可 能 是 其 他 时 钟 之 一 的 typedef。 这 些 时 钟 
与 其 他 时 间 工 具 都 定义 在 <chrono> 类 库 头 文件 中 。 
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我 们 马上 要 看 看 如 何 表示 时 间 点 ， 但 在 此 之 前 ， 先 来 看 看 时 间 段 是 如 何 表示 的 。 


4.3.2 时间 段 


时 间 段 是 时 间 支 持 中 的 最 简单 部 分 ， 它 们 是 由 std: :chrono: :duration<> 类 模板 
(线程 库 使 用 的 所 有 C++ 时 间 处 理工 具 均 位 于 std: : chrono 的 命名 空间 中 ) 进行 处 理 的 。 
第 一 个 模板 参数 为 所 代表 类 型 (如 int, long, m double), 第 二 个 参数 是 个 分 数 ， 指 定 
每 个 时 间 段 单位 表示 多 少 秒 。 例 如 ， 以 short 类 型 存储 的 几 分 钟 的 数目 表示 为 
std::chrono: :duration<short, std: :ratio<60,1>>, 因为 1 分 钟 有 60 秒 。 另 一 
方面 ， 以 double 类 型 存储 的 毫秒 数 则 表示 为 std::chrono::duration«double, 
std: :ratio<1,1000>>， 因 为 1 毫秒 为 1/1000 秒 。 

标准 库 在 std: : chrono 命名 空间 中 为 各 种 时 间 段 提供 了 一 组 预定 义 的 typedef， 
nanoseconds, microseconds, milliseconds, seconds, minutes 和 hours。 
它们 均 使 用 一 个 足够 大 的 整数 类 型 以 供 表示 ， 以 至 于 如 果 你 希望 的 话 ， 可 以 使 用 合适 的 
单位 来 表示 超过 500 年 的 时 间 段 。 还 有 针对 所 有 国际 单位 比例 的 typedef 可 供 指定 自 
定义 时 间 段 时 使 用 ， 从 std::atto (10%) Bstd::exa (108) (还 有 更 大 的 ， 车 你 
的 平台 具有 128 位 整 型 类 型 ), 例如 std::duration<double, std: :centi> 是 以 
double 类 型 表示 的 1/100 秒 的 计时 。 

在 无 需 截 断 值 的 场合 , 时 间 段 之 间 的 转换 是 隐 式 的 (因此 将 小 时 转换 成 秒 是 可 以 的 ， 
但 将 秒 转换 成 小 时 则 不 然 )。 显 式 转换 可 以 通过 std::chrono::duration cast<> 
实现 ， 
std::chrono::milliseconds ms(54802); 


std::chrono::seconds s= 
std: :chrono: :duration_cast<std::chrono: :seconds> (ms) ; 


结果 是 截断 而 非 四 舍 五 人 ， 因 此 在 此 例 中 s 值 为 54。 
时 间 段 支持 算术 运算 ， 因 此 可 以 加 、 减 时 间 段 来 得 到 新 的 时 间 段 ， 或 者 可 以 乘 、 除 
一 个 底层 表示 类 型 (第 一 个 模板 参数 ) 的 常数 。 因 此 5*seconds (1) 和 seconds (5) 
BK minutes (1)-seconds (55) 是 相同 的 时 间 段 中 单位 数量 的 计数 可 以 通过 count () 
成 员 函 数 获 取 。 因 此 std: : chrono: :milliseconds (1234) .count () 为 1234。 
基于 时 间 段 的 等 待 是 通过 std: :chrono: :duration<> 实 例 完 成 的 。 例 如 ， 可 以 
等 待 future 就 绪 最 多 35 毫秒 。 


std::future<int> f-std::async(some task); 
if(f.wait for(std::chrono::milliseconds(35))--std::future status: :ready) 
do something with(f.get()); 


等 待 函数 都 会 返回 一 个 状态 以 表示 等 待 是 否 超时 ， 或 者 所 等 待 的 事件 是 否 发 生 。 在 
这 种 情况 下 ， 你 在 等 待 一 个 fature， 若 等 待 超时 ， 函 数 返 回 std::future status:: 
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timeout, # future MÆ, UAE std: :future_status::ready, 或 者 如 果 future 
任务 推迟 ， 则 返回 std::future status::deferred, 基于 时 间 段 的 等 待 使 用 类 库 
内 部 的 匀速 时 钟 来 衡量 时 间 ， 因 此 35 毫秒 意味 着 35 毫秒 的 逝去 时 间 ， 即 便 系统 时 钟 在 
等 待 期 间 进行 了 调整 (向 前 或 向 后 )。 当 然 , 系统 调度 的 多 变 和 OS 时 钟 的 不 同 精度 意味 
着 线程 之 间 发 出 调用 并 返回 的 实际 时 间 可 能 远 远 长 于 35 毫秒 。 

在 看 过 时 间 段 后 ， 接 下 可 以 继续 看 看 时 间 点 。 


4.3.8 时间 点 


时 钟 的 时 间 点 是 通过 std::chrono: :time point<> 类 模板 的 实例 来 表示 的 , 它 
以 第 一 个 模板 参数 指定 其 参考 的 时 钟 ， 并 且 以 第 二 个 模板 参数 指定 计量 单位 
(std: :chrono: :duration<> 的 特 化 )。 时 间 点 的 值 是 时 间 的 长 度 指定 时 间 段 的 倍 
XO, ， 因 而 一 个 特定 时 间 点 被 称 为 时 钟 的 纪元 〈epoch)。 时 钟 的 纪元 是 一 项 基本 参数 ， 
但 却 不 能 直接 查询 ， 也 未 被 C++ 标准 指定 。 典 型 的 纪元 包括 1970 年 1 月 1 日 00:00， 以 
及 运行 应 用 程序 的 计算 机 引导 启动 的 瞬间 。 时 钟 可 以 共享 纪元 或 拥有 独立 的 纪元 。 如 果 
两 个 时 钟 共享 一 个 纪元 ， 则 在 一 个 类 中 的 time point typedef 可 指定 另 一 个 类 作为 
与 time point 相关 联 的 时 钟 类 型 。 虽 然 无 法 找 出 纪元 的 时 间 所 在 ， 但 可 以 获取 给 定 
time point 的 time_since_epoch () 。 该 成 员 函 数 返回 一 个 时 间 段 的 值 ， 其 指定 了 
从 时 钟 纪元 到 该 时 间 点 的 时 间 长 度 。 

例如 ,你 可 以 指定 一 个 时 间 点 为 std: :chrono::time_point<std::chrono:: 
system clock, std::chrono: :minutes>, 这 将 保持 时 间 与 系统 时 钟 相关 ， 但 却 
以 分 钟 而 不 是 系统 时 钟 的 固有 测量 精度 (通常 为 秒 或 更 小 ) 进行 测量 。 

你 可 以 从 std: :chrono: :time_point<> 的 实例 加 上 和 减 去 时 间 段 来 产生 新 的 时 间 
点 ,因此 std::chrono::high resolution clock::now()* Stditchrono:: 
nanoseconds (500) 将 在 future 中 给 你 500 纳 秒 的 时 间 。 这 对 于 在 知道 代码 块 的 最 大 时 间 段 
情况 下 计算 绝对 超时 是 极 好 的 , 但 若 其 中 有 对 等 待 函数 的 多 个 调用 ,或 是 在 等 待 函数 之 前 有 
非 等 待 函数 ， 就 会 占据 一 部 分 时 间 预 算 。 

你 还 可 以 从 另 一 个 共享 同一 个 时 钟 的 时 间 点 减 去 一 个 时 间 点 。 结 果 为 指定 两 个 时 间 
点 之 间 长 度 的 时 间 段 。 这 对 于 代码 块 的 计时 非常 有 用 ， 例 如 ， 


auto start-std::chrono::high resolution clock::now(); 

do something(); 

auto stopestd::chrono::high resolution clock: :now() ; 

std::cout««"do something() took " 
«egtd: : chrono: :duration<double, std: :chrono: :seconds> (stop-start) .count () 
<<” seconds” <<std::endl; 


然而 std: :chrono: :time_point<> 实 例 的 时 钟 参 数 能 做 的 不 仅仅 是 指定 纪元 。 
当 你 将 时 间 点 传 给 到 接受 绝对 超时 的 等 待 函数 时 ， 时 间 点 的 时 钟 参数 可 以 用 来 测量 时 


86 


第 4 章 同步 并 发 操作 


间 。 当 时 钟 改变 时 会 产生 一 个 重要 的 影响 ， 因 为 这 一 等 待 会 跟踪 时 钟 的 改变 ， 并 且 在 时 
钟 的 now () 函数 返回 一 个 晚 于 指定 超时 的 值 之 前 都 不 会 返回 。 如 果 时 钟 向 前 调整 , 将 减 
少 等 待 的 总 长 度 ( 按 照 匀 速 时 钟 计量 )， 反 之 如 果 向 后 调整 ， 就 可 能 增加 等 待 的 总 长 度 。 
如 你 所 料 ， 时 间 点 和 等 待 函数 的 _until 变种 共同 使 用 。 典 型 用 例 是 在 用 作 从 程序 
中 一 个 固定 点 的 某 个 时 钟 : :now () 开始 的 偏 移 量 , 尽管 与 系统 时 钟 相关 联 的 时 间 点 可 以 
通过 在 对 用 户 可 见 的 时 间 , 用 std: :chrono::system clock: :to time point () 
态 成 员 函 数 从 time t 转换 而 来 。 例 如 ， 如 果 有 一 个 最 大 值 为 500 毫秒 的 时 间 ， 来 等 
待 一 个 与 条 件 变量 相关 的 事件 ， 你 可 以 按 清单 4.11 所 示 来 做 。 


清单 4.11 等待 一 个 具有 超时 的 条 件 变 量 


#include «condition variable» 
#include <mutex> 

#include <chrono> 
std::condition_variable cv; 
bool done; 

std::mutex m; 


bool wait loop() 


auto const timeout- std::chrono::steady clock: :now()+ 
std::chrono: :milliseconds (500); 

std: :unique_lock<std::mutex> 1k(m) ; 

while (!done) 


{ 
if (cv.wait_until(1k,timeout) ==std::cv_status: : timeout) 
break; 
} 


return done; 


如 果 没 有 向 等 待 传递 断言 ， 那 么 这 是 在 有 时 间 限 制 下 等 待 条 件 变 量 的 推荐 方式 。 这 
种 方式 下 ， 循 环 的 总 长 度 是 有 限 的 。 如 4.1.1 节 所 示 ， 当 不 传人 断言 时 ， 需 要 通过 循环 
来 使 用 条 件 变 量 , 以 便 处 理 伪 唤醒 。 如 果 在 循环 中 使 用 wait for () , 可 能 在 伪 唤 醒 前 ， 
就 已 结束 等 待 几乎 全 部 时 长 ， 并 且 在 经 过 下 一 次 等 竺 开始 后 再 来 一 次 。 这 可 能 会 重复 任 
意 次 ， 使 得 总 的 等 待 时 间 无 穷 无 尽 。 

在 看 过 了 指定 超时 的 基础 知识 后 ， 让 我 们 来 看 看 能 够 使 用 超时 的 函数 。 


4.3.4 接受 超时 的 函数 


超时 的 最 简单 用 法 ， 是 将 延迟 添加 到 特定 线程 的 处 理 过 程 中 ， 以 便 在 它 无 所 事 事 的 
时 候 避 免 占用 其 他 线程 的 处 理 时 间 。 在 4.1 节 你 曾 见 过 这 样 的 例子 ， 在 循环 中 轮 询 一 个 
“完成 ”标记 。 处 理 它 的 两 个 函数 是 std::this thread::sleep for() 和 
std::this thread::sleeb_until()。 它 们 像 一 个 基本 的 闹钟 一 样 工 作 : 在 指定 
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IEE (使 用 sleep for () ) 或 直至 指定 的 时 间 点 (使 用 sleep_until () ), 线程 进 
人 睡眠 状态 。sleep_for () 对 于 那些 类 似 于 4.1 节 中 的 例子 是 有 意义 的 ， 其 中 一 些 事情 
必须 周期 性 地 进行 ， 并 且 逝 去 的 时 间 是 重要 的 。 另 一 方面 ，sleep_until O 允许 安排 
线程 在 特定 时 间 点 唤醒 。 这 可 以 用 来 触发 半夜 里 的 备份 , 或 在 早上 6:00 打印 工资 条 , 或 
在 做 视频 回放 时 暂停 线程 直至 下 一 帧 的 刷新 。 

当然 ， 睡眠 并 不 是 唯一 的 接受 超时 的 工具 。 你 已 经 看 到 了 可 以 将 超时 与 条 件 变 量 和 
future 一 起 使 用 。 如 果 互 斥 元 支持 的 话 ， 甚 至 可 以 试图 在 互 斥 元 获得 锁 时 使 用 超时 。 普 
通 的 std: :mutex 和 std::recursive mutex 并 不 支持 锁定 上 的 超时 ， 但 是 
std::timed mutex 和 std::recursive timed mutex 支持 。 这 两 种 类 型 均 支 持 
try lock _ for () 和 try_lock_until() 成 员 函 数 ， 它们 可 以 在 指定 时 间 段 内 或 在 指 
定时 间 点 之 前 尝试 获取 锁 。 表 4.1 展示 了 C++ 标准 库 中 可 以 接受 超时 的 函数 及 其 参数 和 
返回 值 。 列 作 时 间 段 duration) 的 参数 必须 为 std: :auration<> 的 实例 ， 而 那些 列 
HE time point 的 必须 为 std: :time _ point<> 的 实例 。 


表 4.1 接受 超时 的 函数 


sleep. for(duration) 
sleep until(fime point) 


std::this thread 命名 空间 不 可 用 


wait for(lock, std::cv_status:: 


std::condition_variable 5% duration) timeout 或 
std::condition_variable_any wait_until(/ock, std::cv_status:: 
time_point) no_timeout 


wait for(lock, 
duration, predicate) 
wait until(lock, bool 一 当 唤 醒 时 predicate 的 返回 值 
time point, 
predicate) 
try lock for 
std::timed mutex 或 std::recursive (duration) 

b $ be , | 
timed_mutex try lock_until bool—true 如 果 获 得 了 锁 ， 否 则 false 
(time point) 
unique lock(/ockable, 
te i duration) 不 可 用 一 owns_lock() 在 新 构造 的 对 象 上 ;如 
std::unique_lock<TimedLockable> unique. lock(Jockable, 果 获得 了 锁 返 回 true， 和 否则 false 
time point) 


try. lock for(duration) 


try lock until(time point) bool—true 如 果 获 得 了 锁 ， 否 则 false 


std::future_status::timeout 如 果 等 待 超时 ， 
std:future«ValueType» SX std:shared | Wait for(duration) std::future_status::ready 如 果 future 就 绪 或 
future< Value Type> wait_until(time_point) std::future_status::deferred 08 future Rr 
的 延迟 函数 还 没有 开始 
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目前 ,我 已 经 介绍 了 条 件 变 量 、future、promise 和 打包 任务 的 机 制 ， 接 下 来 是 时 候 
看 一 看 更 广 的 图 景 ， 以 及 如 何 利用 它们 来 简化 线程 间 操 作 的 同步 。 


AA 使 用 操作 同步 来 简化 代码 


使 用 截至 目前 在 本 章 中 描述 的 同步 工具 作为 构建 模块 ， 人 允许 你 着 重 关 注 需要 同步 的 
操作 而 非 机 制 。 一 种 可 以 简化 代码 的 方式 ， 是 采用 一 种 更 加 函数 式 的 〈funetional， 在 
函数 式 编程 意义 上 ) 的 方法 来 编写 并 发 程序 。 并 非 直接 在 线程 之 间 共 享 数据 ， 而 是 每 个 
任务 都 可 以 提供 它 所 需要 的 数据 ， 并 通过 使 用 future 将 结果 传播 至 需要 它 的 线程 。 


4.4.1 158 future 的 函数 式 编程 


函数 式 编程 (functional programming, FP) 指 的 是 一 种 编程 风格 ， 函 数 调用 的 结果 
仅 单纯 依赖 于 该 函数 的 参数 而 不 依赖 于 任何 外 部 状态 。 这 与 函数 的 数学 概念 相关 ， 同 时 
也 意味 着 如 果 用 同一 个 参数 执行 一 个 函数 两 次 ， 结 果 是 完全 一 样 的 。 这 是 许多 C++ 标准 
库 中 数学 函数 , 如 sin, cos 和 sqrt, 以 及 基本 类 型 简单 操作 如 3+3, 6*9, 5 1.3/4.7 
的 特性 。 纯 函数 也 不 修改 任何 外 部 状态 ， 函 数 的 影响 完全 局 限 在 返回 值 上 。 

这 使 得 事情 变 得 易于 思考 ,尤其 当 涉 及 并 发 时 ， 因 为 第 3 章 中 讨论 的 许多 与 共享 内 
存 相关 的 问题 不 复 存在 。 如 果 没 有 修改 共享 数据 ， 那 么 就 不 会 有 竞争 条 件 ， 因 此 也 就 没 
有 必要 使 用 互 斥 元 来 保护 共享 数据 。 这 是 一 个 如 此 强大 的 简化 ， 使 得 诸如 Haske 册 这样 
的 编程 语言 ， 在 默认 情况 下 其 所 有 函数 都 是 纯 函 数 ， 开 始 在 编写 并 发 系统 中 变 得 更 为 流 
行 。 因 为 大 多 数 东 西 都 是 纯 的 ， 实 际 上 的 确 修改 共享 状态 的 非 纯 函数 就 显得 锥 立 鸡 群 ， 
因而 也 更 易于 理解 它们 是 如 何 纳入 应 用 程序 整体 结构 的 。 

然而 函数 式 编程 的 好 处 不 仅仅 局 限 在 那些 将 其 作为 默认 范 型 的 语言 。C++ 是 一 种 多 
范 型 语言 ， 它 完全 可 以 用 FP 风格 编写 程序 。 随 着 lambda 函数 (参见 附录 A 中 A.6 节 ) 
的 到 来 ， 从 Boost 到 TR1 的 std: :bind 合并 ,和 自动 变量 类 型 推断 的 引入 (参见 附录 
A 中 A.7 节 ),， C++11 HE C++98 更 为 容易 实现 函数 式 编程 。future 是 使 得 C++ 中 FP 风格 
的 并 发 切实 可 行 的 最 后 一 块 拼 图 。 一 个 future 可 以 在 线程 间 来 回 传递 ， 使 得 一 个 线程 的 
计算 结果 依赖 于 男 一 个 的 结果 ， 而 无 需 任 何 对 共享 数据 的 显 式 访问 。 


1. FP 风格 快速 排序 
为 了 说 明 在 FP 风格 并 发 中 future 的 使 用 ， 让 我 们 来 看 一 个 简单 的 快速 排序 算法 的 
实现 。 算 法 的 基本 思想 很 简单 ， 给 定 一 列 值 ， 取 一 个 元 素 作为 中 轴 ， 然 后 将 列表 分 为 两 


! 参见 http://www.haskell.org/, 
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组 一 比 中 轴 小 的 为 一 组 ， 大 于 等 于 中 轴 的 为 一 组 。 列表 的 已 排序 副本 ， 可 以 通过 对 这 
两 组 进行 排序 ， 并 按照 先是 比 中 轴 小 的 值 已 排序 列表 ， 接 着 是 中 轴 ， 再 后 返回 大 于 等 于 
中 轴 的 值 已 排序 列表 的 顺序 进行 返回 来 获取 。 图 4.2 展示 了 10 个 整数 的 列表 是 如 何 根据 
此 步 又 进行 排序 的 。FP 风格 的 顺序 实现 在 随后 的 代码 中 展示 ， 它 通过 值 的 形式 接受 并 
返回 列表 ， 而 不 是 像 sta: : sort O 那样 就 地 排序 。 


图 4.2 FP 风格 递归 排序 


清单 4.12 ”快速 排序 的 顺序 实 


template<typename T» 
std::list<T> sequential quick sort (std::list<T> input) 


{ 


现 


if (input.empty () ) 


{ 
} 


std::list<T> result; 
result .splice (result .begin(),input,input.begin()); 0 
T const& pivot-*result.begin(); 0 


return input; 


auto divide point-std::partition(input.begin(),input.end(), 
[&] (T const& t) (return t<pivot;}); ^e 


Std::list«T» lower part; 
lower part.splice(lower part.end(),input,input.begin(), 


divide point); ^o 


auto new lower( 


sequential quick sort (std::move(lower part))); +@ 
auto new_higher ( 
sequential quick sort (std: :move (input) )); +@ 


result .splice (result .end() ,new_higher) ; +@ 
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result.splice(result.begin(),new lower); «— 
return result; 


] 

尽管 接口 是 FP 风格 的 ,如 果 你 自始至终 使 用 FP 风格 ， 就 会 制作 很 多 的 副本 ， 即 你 
在 内 部 使 用 了 “标准 ” 祈 使 风格 。 取 出 第 一 个 元 素 作为 中 轴 , 方法 是 用 splice()@ 将 
其 从 列表 前 端 切 下 。 虽 然 这 样 可 能 会 导致 一 个 次 优 排 序 (考虑 到 比较 和 交换 的 次 数 )， 
由 于 列表 遍历 的 缘故 ， 用 std: :1ist 做 任何 其 他 事 都 可 能 增加 很 多 的 时 间 。 你 已 知 要 
在 结果 中 得 到 它 ， 因 此 可 以 直接 将 其 拼接 至 将 要 使 用 的 列表 中 。 现 在 ， 你 还 会 想 要 将 其 
作 比 较 ， 因 此 让 我 们 对 它 进行 引用 ， 以 避免 复制 @。 接 着 可 以 使 用 std::partition 
将 序列 划分 成 小 于 中 轴 的 值 和 不 小 于 中 轴 的 值 9 指定 划分 依据 的 最 简单 方式 是 使 用 一 
个 lambda PRA, 使 用 引用 捕获 以 避免 复制 pivot 的 值 (参见 附录 A 中 A.5 节 更 多 地 了 
fi lambda 函数 )。 

std: :partition() 就 地 重新 排列 列表 ， 并 返回 一 个 迭代 器 ， 它 标记 着 第 一 个 不 
小 于 中 轴 值 的 元 素 。 氨 代 器 的 完整 类 型 可 能 相当 元 长 , 因此 可 以 使 用 auto 类 型 说 明 符 ， 
使 得 编译 器 帮 你 解决 (参见 附录 A 中 A.7 节 )。 

现在 ,你 已 经 选择 了 FP 风格 接口 ， 因 此 如 果 打 算 使 用 递归 来 排序 这 两 “ 半 ”， 则 需 
要 创建 两 个 列表 。 可 以 通过 再 次 使 用 splice () 将 从 input 到 divide point 的 值 移 
动 至 一 个 新 的 列表 : lower_part@。 这 使 得 input 中 只 仅 留 下 剩余 的 值 。 你 可 以 接着 
用 递归 调用 对 这 两 个 列表 进行 排序 日 、@。 通 过 使 用 std: :move () 传人 列表 ， 也 可 以 
在 此 处 避免 复制 一 一 但 是 结果 也 将 被 隐 式 地 移动 出 来 。 最 后 , 你 可 以 再 次 使 用 splice () 
将 result 以 正确 的 顺序 连 起 来 。new_higher 值 在 中 轴 之 后 直到 末尾 @， 而 
new_lower 值 从 开始 起 ， 直 到 中 轴 之 前 @。 


2. FP 风格 并 行 快速 排序 


由 于 已 经 使 用 了 函数 式 风格 ,通过 future 将 其 转换 成 并 行 版 本 就 很 容易 了 ， 如 清音 
4.13 所 示 。 这 组 操作 与 之 前 相同 ， 区 别 在 于 其 中 一 部 分 现在 并 行 地 运行 。 此 版 本 使 用 
future 和 函数 式 风格 实现 快速 排序 算法 。 


清单 4.13 使 用 future 的 并 行 快速 排序 


template<typename T» 
Std::list«T» parallel quick sort(std::list«T» input) 
{ 


if(input.empty()) 


return input; 
) 
Std::list«T» result; 
result.splice(result.begin(),input,input.begin()); 
T const& pivot-*result.begin(); 
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auto divide point-std::partition(input.begin(),input.end(), 
[&] (T const& t) (return t«pivot;]); 


Std::list«T» lower part; 
lower part.splice(lower part.end(),input,input.begin(), 


divide point); 
std::future<std::list<T> > new lower( Pa 
std::async(&parallel quick sort«T»,std::move(lower part))); 


auto new higher( 
parallel quick sort (std::move(input))); -© 


result.splice(result.end(),new higher); 
result .splice (result .begin() ,new_lower.get ()); 0 
return result; 


} 

这 里 最 大 的 变化 是 ， 没 有 在 当前 线程 中 对 较 小 的 部 分 进行 排序 ， 而 是 在 另 一 个 线程 中 
使 用 std: :async () 对 其 进行 排序 @。 列表 的 上 部 分 跟 之 前 一 样 直 接 递 轨 @ 进 行 排序 。 通 
过 递归 调用 parallel quick sort O ， 你 可 以 充分 利用 现 有 的 硬件 并 发 能 力 。 如 果 
std: :async () 每 次 启动 一 个 新 的 线程 ， 那 么 如 果 你 向 下 递归 三 次 ， 就 会 有 8 个 线程 在 运 
行 ， 如 果 向 下 递归 10 次 (对 大 约 1000 个 元 素 ) ， 如 果 硬 件 可 以 处 理 的 话 ， 就 将 有 1024 个 
线程 在 运行 。 如 果 类 库 认 定 产 生 了 过 多 的 任务 (也许 是 因为 任务 的 数量 超过 了 可 用 的 硬件 
并 发 能 力 ) ， 则 可 能 改 为 同步 地 产生 新 任务 。 他 们 会 在 调用 get O 的 线程 中 运行 ， 而 不 是 在 
新 的 线程 中 ， 从 而 避免 在 不 利于 性 能 的 情况 下 把 任务 传递 到 另 一 个 线程 的 开销 。 值 得 注意 
的 是 , 对 于 std: :async 的 实现 来 说 , 只 有 显 式 指定 了 std::launch: :deferred 再 为 
每 一 个 任务 开启 一 个 新 线程 (其 至 在 面 对 大 量 的 过 度 订阅 时 )， 或 是 只 有 显 式 指定 了 
std::launch::async 再 同步 运行 所 有 任务 ， 才 是 完全 符合 的 。 如 果 依 靠 类 库 进行 自动 
判定 ， 建 议 你 查阅 一 下 这 一 实现 的 文档 ， 看 一 看 它 究竟 表现 出 什么 样 的 行为 。 

与 其 使 用 std: :async() ， 不 如 自行 编写 spawn task () 函数 作为 sta:: 
packaged task 和 std: :thread 的 简单 封装 ， 如 清单 4.14 所 示 ， 为 函数 调用 结果 创建 
T—^ std::packaged task， 从 中 获取 future， 在 线程 中 运行 之 并 返回 future, HAH 
并 不 会 带 来 多 少 优点 (实际 上 可 能 导致 大 量 的 过 度 订阅 ) ， 但 它 为 迁移 到 一 个 更 复杂 的 实现 
做 好 准备 ， 它 通过 一 个 工作 线程 池 ， 将 任务 添加 到 一 个 即将 运行 的 队列 里 。 我 们 会 在 第 9 
章 研究 线程 池 。 相 比 于 使 用 std: :async， 只 有 在 你 确实 知道 将 要 做 什么 ， 并 且 和 希望 想 要 
通过 线程 池 建 立 的 方式 进行 完全 掌控 和 执行 任务 的 时 候 ， 才 值得 首选 这 种 方法 。 

KZ, [AZ| parallel quick sort, 因为 只 是 使 用 直接 递归 获取 new higher, 你 
可 以 将 其 拼接 到 之 前 的 位 置 @ 。 但 是 现在 new lower td future<std:: 
list<T>> 而 不 仅 是 列表 ， 因 此 需要 在 调用 splice () 之 前 调用 get O 来 获取 值 @。 这 就 
会 等 待 后 台 任务 完成 ， 并 将 结果 移动 至 splice () 调用 ，get () 返回 一 个 引用 了 所 包含 结 
果 的 右 值 ， 所 以 它 可 以 被 移 除 (参见 附录 A 中 A.1.1 节 更 多 地 了 解 右 值 引用 和 移动 语义 ) 。 

即使 假设 std: :async () 对 可 用 的 硬件 并 发 能 力 进行 最 优化 的 使 用 ， 这 仍 不 是 快 
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速 排序 的 理想 并 行 实现 。 原 因 之 一 是 ，stq: :partition 完成 了 很 多 工作 ， 且 仍 为 一 
个 连续 调用 ,但 对 于 目前 已 经 足够 好 了 。 如 果 你 对 最 快 可 能 的 并 行 实现 有 兴趣 ， 请 查阅 
学 术 文 献 。 


清单 4.14 ”一 个 简单 spawn task 的 实现 


template<typename F,typename A> 

Std::future«std::result of«F(A&&)»::type» 
Spawn task(F&& f,A&& a) 

( 


typedef std::result of«F(A&&)»::type result type; 

Std::packaged task«result type (A&&) > 
task(std::move(£))); 

Std::future«result type» res(task.get future()); 

std::thread t(std::move(task),std::move (a)) ; 

t.detach(); 

return res; 


函数 式 编程 并 不 是 唯一 的 避 开 共享 可 变数 据 的 并 发 编程 范式 ， 另 一 种 范式 为 CSP 
(Communicating Sequential Process， 通 信 顺 序 处 理 ) !， 这 种 范式 下 线程 在 概念 上 完全 独 
立 ， 没 有 共享 数据 ,但 是 具有 人 允许 消息 在 它们 之 间 进 行 传递 的 通信 通道 。 这 是 被 编程 语 
言 Erlang (http://www.erlang.org/) 所 采用 的 范式 ， 也 通常 被 MPI (Message Passing 
Interface， 消 息 传递 接口 ) (http://www.mpi-forum.org/) 环境 用 于 C 和 C++ 中 的 高 性 能 计 
算 。 我 可 以 肯定 到 目前 为 止 ， 你 不 会 对 这 在 C++ 中 也 可 以 在 一 些 准则 下 得 到 支持 而 感到 
意外 ， 接 下 来 的 一 节 将 讨论 实现 这 一 点 的 一 种 方式 。 


44.2 ”具有 消息 传递 的 同步 操作 


CSP 的 思想 很 简单 ， 如 果 没 有 共享 数据 ， 则 每 一 个 线程 可 以 完全 独立 地 推理 得 到 ， 
只 需 基于 它 对 所 接收 到 的 消息 如 何 进 行 反应 。 因 此 每 个 线程 实际 上 可 以 等 效 为 一 个 状态 
Pi. 当 它 接收 到 消息 时 ， 它 会 根据 初始 状态 进行 操作 ， 并 以 某 种 方式 更 新 其 状态 ， 并 可 
能 向 其 他 线程 发 送 一 个 或 多 个 消息 。 编 写 这 种 线程 的 一 种 方式 ， 是 将 其 形式 化 并 实现 一 
个 有 限 状 态 机 模型 ， 但 这 并 不 是 唯一 的 方式 。 状 态 机 在 应 用 程序 结构 中 可 以 是 隐 式 的 。 
在 任 一 给 定 的 情况 下 ， 究 竟 哪 种 方法 更 佳 ， 取决 于 具体 形势 的 行为 需求 和 编程 团队 的 专 
长 。 但 是 选择 实现 每 一 个 线程 ， 则 将 其 分 割 成 独立 的 进程 可 能 会 从 共享 数据 并 发 中 移 除 
很 多 复杂 性 ， 因 而 使 得 编程 更 加 容易 ， 降 低 了 错误 率 。 

真正 的 通信 序列 进程 并 不 共享 数据 ， 所 有 的 通信 都 通过 消息 队列 , 但 由 于 C++ 线程 
共享 一 个 地 址 空间 ， 因 此 不 可 能 强制 执行 这 一 需求 。 这 就 是 准则 介入 的 地 方 。 作 为 应 用 


i Communicating Sequential Processes, C.A.R. Hoare, Prentice Hall, 1985. Available free online 
at http://www.usingcsp.com/cspbook.pdf 
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程序 或 类 库 的 作者 ， 我 们 的 责任 是 确保 我 们 不 在 线程 间 共 享 数据 。 当 然 ， 为 了 线程 之 间 
的 通信 ， 消 息 队列 必须 是 共享 的 ， 但 是 其 细节 可 以 封装 在 类 库 内 。 

想象 一 下 ， 你 正在 实现 ATM 的 代码 。 此 代码 需要 处 理 人 试图 取 钱 的 交互 和 与 相关 
银行 的 交互 ， 还 要 控制 物理 机 器 接受 此 人 的 卡片 ， 显 示 恰 当 的 信息 ， 处 理 按键 ， 出 钞 并 
退回 用 户 的 卡片 。 

处 理 这 一 切 事 情 的 其 中 一 种 方法 ， 是 将 代码 分 成 三 个 独立 的 线程 : 一 个 处 理 物 理 机 器 、 
一 个 处 理 ATM 逻辑 、 还 有 一 个 与 银行 进行 通信 。 这 些 线程 可 以 单纯 地 通过 传递 消息 而 非 共 
训 数 据 进行 通信 。 例 如 ， 当 有 人 在 机 器 旁边 将 卡 插入 或 按 下 按钮 时 ， 处 理 机 器 的 线程 可 以 
发 送 消息 至 逻辑 线程 ， 同 时 逻辑 线程 将 发 送 消息 至 机 器 线程 ， 指 示 要 发 多 少 钱 等 等 。 

对 ATM 逻辑 进行 建 模 的 一 种 方式 ， 是 将 其 视 为 一 个 状态 机 。 在 每 种 状态 中 ， 线 程 
等 待 可 接受 的 消息 ， 然 后 对 其 进行 处 理 。 这 样 可 能 会 转换 到 一 个 新 的 状态 ,并 且 循环 继 
续 。 一 个 简单 实现 中 所 涉及 的 状态 如 图 4.3 所 示 。 在 这 个 简化 了 的 实现 中 ， 系 统 等 待 卡 
片 插入 。 一 旦 卡片 插入 ， 便 等 待 用户 输 入 其 密码 ， 每 次 一 个 数字 。 他 们 可 以 删除 最 后 输 
入 的 数字 。 一 旦 输入 的 数字 足够 多 ， 就 验证 密码 。 如 果 密 码 错 误 ， 则 结束 ,将 卡片 退回 
给 用 户 ， 并 继续 等 待 有 人 插入 卡片 。 如 果 密 码 正确 ， 则 等 待 用 户 取消 交易 或 选择 取出 的 
金额 。 如 果 用 户 取消 ， 则 结束 ， 并 退出 银行 卡 。 如 果 用 户 选择 了 一 个 金额 ， 则 等 待 银行 
确认 后 发 放 现金 并 退出 其 卡片 ， 或 者 显示 “资金 不 足 ” 的 消息 并 退出 其 卡片 。 显 然 ， 真 
EH ATM 比 这 复杂 得 多 ， 但 这 已 经 足以 阐述 整个 想法 。 


按 下 数字 键 ( 最 后 一 位 ) 


(提供 钞票 ) 等 待 确认 


图 4.3 ATM 的 简单 状态 机 模型 


第 4 章 同步 并 发 操作 


有 了 ATM 逮 辑 的 状态 机 设计 之 后 ， 就 可 以 使 用 一 个 具有 表示 每 一 个 状态 的 成 员 函 
数 的 类 来 实现 之 。 每 一 个 成 员 函 数 都 可 以 等 待 指定 的 一 组 传人 消息 ， 并 在 它们 到 达 后 进 
行 处 理 , 其 中 可 能 触发 切换 到 另 一 状态 ,每 个 不 同 的 消息 类 型 可 以 由 一 个 独立 的 struct 
来 表示 。 清 单 4.15 展示 了 这 样 一 个 系统 中 ATM 逻辑 的 部 分 简单 实现 ， 包 括 主 循环 和 第 
一 个 状态 的 实现 ， 即 等 待 卡片 插入 。 

如 你 所 见 ， 所 有 消息 传递 所 必需 的 同步 完全 隐藏 于 消息 传递 库 内 部 (其 基本 实现 以 
及 本 示例 的 完整 代码 见 附录 C). 


清单 4.15 ATM 逻辑 类 的 简单 实现 


struct card inserted 


{ 
}; 


class atm 


{ 


std::string account; 


messaging: :receiver incoming; 
messaging: :sender bank; 
messaging::sender interface_hardware; 
void (atm::*state) (); 


std::string account; 
std::string pin; 


void waiting for card() 0 
{ 
interface hardware.send(display enter card()); a 
incoming.wait() 
.handle«card inserted»( “e 
[&] (card inserted const& msg) 0 


{ 
account=msg.account ; 
pin=" "> 
interface hardware.send(display enter pin()); 
State-&atm::getting pin; 

} 

di 

} 


void getting pin(); 


public: 
void run() 0 
{ 
State-&atm::waiting for card; +@ 
try 
{ 
for (77) 


{ 
} 


(this->*state) (); «9 
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catch(messaging::close queue const&) 
{ 
} 
} 
2» 


正如 已 经 提 到 的 , 这 里 所 描述 的 实现 是 从 ATM 所 需 的 真正 逻辑 中 粗略 简化 而 来 的 ， 
但 这 确实 给 你 一 种 消息 传递 的 编程 风格 的 感受 。 没 有 必要 去 考虑 同步 和 并 发 的 问题 ， 只 
要 考虑 在 任意 一 个 给 定 的 店 ， 可 能 会 接收 到 哪些 消息 ， 以 及 该 发 送 哪些 消息 。ATM iP 
辑 的 状态 机 在 单线 程 上 运行 ， 而 系统 的 其 他 部 分 ， 比 如 银行 的 接口 和 终端 的 接口 ， 则 在 
独立 的 线程 上 运行 。 这 种 程序 设计 风格 被 称 作 行为 角色 模型 (actor model) 一 一 系统 中 
有 多 个 离散 的 角色 ( 均 运 行 在 独立 线程 上 ) ， 用 来 相互 发 送 消息 以 完成 手头 任务 ， 除 了 
直接 通过 消息 传递 的 状态 外 ， 没 有 任何 共享 状态 。 

执行 是 由 run () 成 员 函 数 开始 的 @， 设 置 初始 状态 为 waiting_for_card@ 并 
重复 执行 代表 当前 状态 (不 管 它 是 什么 ) 的 成 员 函 数 @。 状 态 函 数 就 是 a cm 类 的 简单 成 
FMM, waiting for card 状态 函数 9 也 很 简单 : 发 送 一 则 消息 至 界面 以 显示 “等 
待 卡片 ”的 消息 @， 接 着 等 待 要 处 理 的 消息 。 这 里 能 处 理 的 唯一 消息 类 型 是 
card inserted 消息 @， 可 以 通过 lambda 函数 进行 处 理 @。 你 可 以 将 任意 函数 或 函 
数 对 象 传递 给 handle 函数 ， 但 是 像 这 种 简单 的 情况 ， 用 lambda 是 最 容易 的 。 注 意 
handle () 函数 调用 是 链接 至 wait () 函数 的 。 如 果 接 收 到 的 消息 不 匹配 指定 的 类 型 ， 
它 将 被 丢弃 ， 线 程 将 继续 等 待 直至 接收 到 匹配 的 消息 。 

lambda 函数 本 身 只 是 将 卡片 中 的 账户 号 码 缓存 至 一 个 成 员 变 量 中 ， 清 除 当 前 密码 ， 
发 送 消息 给 接口 硬件 以 显示 要 求 用 户 输入 其 密码 ， 改 为 “获取 密码 ”状态 。 一 旦 消息 处 
理 程序 完成 ， 状 态 函数 即 返回 ， 同 时 主 循环 调用 新 的 状态 函数 @。 

getting pin 状态 函数 略 有 些 复杂 ， 它 可 以 处 理 三 种 不 同类 型 的 消息 ， 如 图 4.3 
所 示 。 由 清单 4.16 加 以 展示 。 


清单 4.16 ”简单 ATM 实现 的 getting pin 状态 函数 


void atm: :getting pin() 
{ 
incoming. wait () 
.handle«digit pressed»( 
[&] (digit pressed const& msg) 
{ 
unsigned const pin_length=4; 
pin+=msg.digit; 
if (pin. length () ==pin_length) 
{ 
bank.send(verify_pin(account,pin, incoming) ) ; 
state=&atm: : verifying pin; 


} 
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) 


| mí 
.handle«clear last pressed»( 
[&] (Clear last pressed const& msg) 


if(!pin.empty()) 


pin.resize(pin.length()-1); 
) 
} 


: - 
-handle<cancel_pressed> ( 
[&] (cancel_pressed const& msg) 


{ 


State-&atm::done processing; 


) 
i 

这 时 ， 有 三 种 能 够 处 理 的 消息 类 型 ， 所 以 wait () 函数 有 三 个 handle () 调用 链接 
BBO, 09, 0, 每 一 次 对 handle O 的 调用 将 消息 类 型 指定 为 模板 参数 ， 然 后 传 至 
接受 该 特定 消息 类 型 作为 参数 的 lambda 函数 。 由 于 调用 通过 这 种 方式 链接 起 来 ,wait () 
的 实现 知道 它 正 在 等 待 一 个 daigit_pressed $M, clear last pressed 消息 或 是 
cancel pressed 消息 。 任 何其 他 类 型 的 消息 将 再 次 被 丢弃 。 

这 时 ， 在 获取 消息 之 后 你 并 不 一 定 非 要 改变 状态 。 例 如 ， 如 果 你 得 到 了 一 
digit pressed 消息 , 仅 需 将 它 添加 至 pin， 除 非 它 为 最 后 的 数字 。 清 单 4.15 PHE 
循环 @ 将 再 次 调用 getting pin () 来 等 待 下 一 个 数字 (或 是 清除 或 取消 )。 

这 对 应 于 图 4.3 所 示 的 行为 。 每 一 个 状态 框 通过 不 同 的 成 员 函 数 来 实现 ， 它 们 等 待 
相关 的 消息 并 适当 地 更 新 状态 。 

如 你 所 见 ， 这 种 编程 风格 可 以 大 大 简化 设计 并 发 系统 的 任务 ， 因 为 每 个 线程 可 以 完 
全 独立 地 对 待 。 这 就 是 使 用 多 线程 来 划分 关注 点 的 一 个 例子 ,并且 需要 你 明确 决定 如 何 
在 线程 间 划 分 任务 。 


} 


小 结 


线程 间 的 同步 操作 ， 是 编写 一 个 使 用 并 发 的 应 用 程序 的 重要 组 成 部 分 。 如 果 没 有 同 
步 ， 那 么 线程 本 质 上 是 独立 的 ， 就 可 以 被 写作 独立 的 应 用 程序 ， 由 于 它们 之 间 存 在 相关 
活动 而 作为 群 组 运行 。 在 本 章 中 ， 我 介绍 了 同步 操作 的 各 种 方式 ， 从 最 基本 条 件 变量 ， 
到 future, promise 以 及 打包 任务 。 我 还 讨论 了 解决 同步 问题 的 方式 ， 函 数 式 编程 ， 其 中 
每 个 任务 产生 的 结果 完全 依赖 于 它 的 输入 而 不 是 外 部 环境 ， 以 及 消息 传递 ， 其 中 线程 间 
的 通信 和 是 通过 一 个 扮演 中 介 和 角色 的 消息 子 系统 发 送 异步 消息 来 实现 的 。 

我 们 已 经 讨论 了 许多 在 C++ 中 可 用 的 高 阶 工 具 , 现在 是 时 候 来 看 看 令 这 一 切 得 以 运 
转 的 底层 工具 了 : C++ 内 存 模 型 和 原子 操作 。 


——— 
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CH 标准 中 最 重要 的 特性 之 一 ， 是 大 多 数 程序 员 甚至 都 不 会 关注 的 东西 。 它 并 不 
是 新 的 语法 特性 ， 也 不 是 新 的 类 库 功能 ， 而 是 新 的 多 线程 感知 内 存 模 型 。 若 是 没有 内 存 
模型 来 严格 定义 基本 构造 模块 如 何 工作 ， 我 所 介绍 的 功能 就 不 能 可 靠 地 工作 。 当 然 ， 大 
多 数 程序 员 没有 注意 到 它 是 有 原因 的 。 如 果 使 用 互 斥 元 来 保护 数据 ， 以 及 条 件 变量 或 者 
future 作为 事件 信和 号， 它们 为 何 工作 的 细节 就 不 重要 了 。 仅 当 你 开始 尝试 “接近 机 器 - 
时 ， 内 存 模 型 的 精确 细节 才 重 要 。 

无 论 其 他 语言 如 何 ，C++ 是 一 门 系统 编程 语言 。 标 准 委员 会 的 目标 之 一 ， 是 不 再 需 
要 一 个 比 C++ 更 低级 的 语言 。 应 该 在 C++ 里 为 程序 员 提供 足够 的 灵活 性 ， 在 做 任何 他 们 
需要 的 事情 时 不 会 被 语言 挡 在 路 中 间 ， 并 且 在 提出 需求 时 允许 他 们 “接近 机 器 。 原 子 
类 型 和 操作 正 是 要 人 允许 这 一 点 ， 提 供 了 可 通常 减 至 一 或 两 个 CPU 指令 的 低 阶 同步 操作 
的 功能 。 

在 本 章 中 ,我 将 从 阐述 内 存 模型 的 基础 开始 ， 接 着 转 到 原子 类 型 和 操作 ， 并 最 终 介 
绍 可 用 于 原子 类 型 上 操作 的 多 种 同步 类 型 。 这 是 相当 复杂 的 ， 除 非 你 打算 使 用 原子 操作 
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编写 代码 以 实现 同步 (比如 第 7 章 中 的 无 锁 数据 结构 ) ， 否 则 无 需 知道 这 些 细节 。 
让 我 们 放 轻 松 ， 来 看 看 内 存 模型 的 基础 。 


内 存 模型 基础 


内 存 模型 包括 两 个 方面 : 基本 结构 方面 ， 这 与 事物 是 如 何 放置 在 内 存 中 的 有 关 ， 然 
后 是 并 发 方面 。 结 构 方面 对 于 并 发 是 很 重要 的 ， 尤 其 从 低级 原子 操作 中 来 看 ， 因 此 我 将 
从 这 里 开始 。 在 C++ 中 ， 一 切 都 是 关于 对 象 和 内 存 位 置 。 


对 和 象 和 内 存 位 置 


C++ 程序 中 的 所 有 数据 均 是 由 对 象 Cobject) 组 成 的 。 这 并 不 是 说 你 可 以 创建 一 个 
派生 自 int 的 新 类 , 或 是 基本 类 型 具有 成 员 函 数 , 或 者 当 人 们 谈 及 如 Smalltalk 或 Ruby 
这 样 的 语言 , 说 “一 切 都 是 对 象 ”时 瞳 指 的 任何 其 他 结果 。 这 只 是 一 句 关于 C++ 中 数据 
的 构造 块 的 一 种 陈述 。 C++ 标 准 定义 对 象 为 “存储 区 域 ”, 尽管 它 会 为 这 些 对 象 分 配属 性 ， 
如 它们 的 类 型 和 生存 期 。 

其 中 一 些 对 象 是 简单 基本 类 型 的 值 ， 如 int 或 float， 而 另 一 些 则 是 用 户 定义 类 
的 实例 。 有 些 对 象 (例如 数组 、 派 生 类 的 实例 和 具有 非 静 态 数 据 成 员 类 的 实例 ) 具有 子 
对 象 ， 但 其 他 的 则 没有 。 

无 论 什 么 类 型 ， 对 象 均 被 存储 于 一 个 或 多 个 内 存 位 置 中 。 每 个 这 样 的 内 存 位 置 要 么 
是 一 个 标量 类 型 的 对 象 (或 子 对 象 ) ， 比 如 unsigned short W my class*, 要么 是 
相 邻 位 域 的 序列 。 如 果 使 用 位 域 ， 有 非常 重要 的 一 点 必须 注意 : 虽然 相 邻 的 位 域 是 不 同 
的 对 象 ， 但 它们 仍然 算 作 相同 的 内 存 位 置 。 图 5.1 表示 了 一 个 struct 如 何 划 分 为 对 象 
和 内 存 位 置 。 

首先 , 整个 struct 是 一 个 对 象 ， 它 由 几 个 子 对 象 组 成 ， 各 子 对 象 对 应 每 个 数据 成 
员 。 位 域 bpf1 和 bf2 共享 一 个 内 存 位 置 ， 而 std::string 对 象 在 内 部 由 几 个 内 存 位 
置 组 成 ， 但 是 其 余 的 每 个 成 员 都 有 自己 的 内 存 位 置 。 注 意 零 长 度 的 位 域 bf3 是 如 何 将 
bf4 分 割 进 它 自 己 的 内 存 位 置 的 。 

可 以 从 中 汲取 四 个 要 点 。 

WB 每 个 变量 都 是 一 个 对 象 ， 包 括 其 他 对 象 的 成 员 。 

E 每 个 对 象 占据 至 少 一 个 内 存 位 置 。 

W 如 int 或 char 这 样 的 基本 类 型 的 变量 恰好 一 个 内 存 位 置 ， 不论 其 大 小 ， 即 便 

它们 相 邻 或 是 数组 的 一 部 分 。 

图 ” 相 邻 的 位 域 是 相同 内 存 位 置 的 一 部 分 。 

我 可 以 肯定 你 在 怀疑 这 与 并 发 有 什么 关系 ， 那 么 让 我 们 来 看 一 看 。 
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内 存 位 置 


gu 


图 5.1 将 struct 划分 为 对 象 和 内 存 位 置 


5.1.2 对象、 内 存 位 置 以 及 并 发 


ET, 这 里 是 对 于 C++ 中 多 线程 应 用 程序 至 关 重 要 的 部 分 ， 所 有 东西 都 取决 于 这 些 
内 存 位 置 。 如 果 两 个 线程 访问 不 同 的 内 存 位 置 ， 是 没有 问题 的 ， 一 切 工作 正常 。 另 一 方 
面 ， 如 果 两 个 线程 访问 相同 的 内 存 位 置 ， 那 么 你 就 得 小 心 了 。 如 果 线 程 都 没有 在 更 新 该 
内 存 位 置 ， 没 问题 ， 只 读数 据 不 需要 进行 保护 或 同步 。 如 果 任意 一 个 线程 正 修 改 数据 ， 
就 会 有 竞争 条 件 的 可 能 ， 如 第 3 章 所 述 。 

为 了 避免 竞争 条 件 ， 在 这 两 个 线程 的 访问 中 间 ， 就 必须 有 一 个 强制 的 顺序 。 确 保有 
一 个 确定 顺序 的 方法 之 一 ,是 使 用 如 第 3 章 中 所 述 的 互 斥 元 。 如 果 同 一 个 互 斥 元 在 两 个 
访问 之 前 被 锁定 ， 则 每 次 只 有 一 个 线程 可 以 访问 该 内 存 位 置 ， 即 有 一 个 必然 发 生 在 另 一 
个 之 前 。 另 一 种 方法 是 在 相同 的 或 是 其 他 的 内 存 位 置 使 用 原子 atomic) 操作 的 同步 特 
性 (参见 5.2 节 对 原子 操作 的 定义 )， 在 两 个 线程 的 访问 之 间 强 加 一 个 顺序 。 用 原子 操作 
来 强制 顺序 描述 于 5.3 节 。 如 果 多 于 两 个 线程 访问 同一 个 内 存 位 置 ， 则 每 一 对 访问 都 必 
须 具有 明确 的 顺序 。 

如 果 来 自 独立 线程 的 两 个 对 同一 内 存 位 置 的 访问 没有 强制 顺序 , 其 中 一 个 或 两 个 访 
问 不 是 原子 的 ， 且 一 个 或 两 个 是 写 操作 ， 那 么 这 就 是 数据 竞争 并 导致 未 定义 行为 。 

这 个 陈述 是 至 关 重 要 的 : 未 定义 行为 是 C++ 最 令 人 不 更 的 状况 之 一 。 根 据 语 言 标准 ， 
一 旦 应 用 程序 包含 未 定义 行为 , 那么 一 切 都 很 难说 , 整个 应 用 程序 的 行为 都 是 未 定义 的 ， 
它 能 干 出 任何 事情 来 。 我 所 知道 的 一 个 情况 是 ， 某 个 未 定义 行为 的 实例 导致 某 人 的 监视 
器 着 火 了 。 虽 然 这 不 大 可 能 发 生 在 你 身上 ， 但 数据 竞争 绝对 是 一 个 严重 的 错误 ， 且 应 该 
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不 惜 一 切 代价 来 避免 。 

在 该 陈述 中 ,还 有 另外 一 个 很 重要 的 点 ; 可 以 通过 使 用 原子 操作 来 访问 具有 竞争 的 
DEME, 来 避免 不 确定 行为 。 这 并 不 阻止 竞争 本 身 一 一 原子 操作 所 接触 的 内 存 位 置 首 
先 仍 是 未 指定 的 一 一 但 是 却 能 够 将 程序 带 回 确定 行为 的 领域 。 

在 学 习 原 子 操作 前 ， 还 有 一 个 对 了 解 对 象 与 内 存 位 置 很 重要 的 概念 : 修改 顺序 。 


5.1.3 ”修改 顺序 


5.2 


C++ 程 序 中 每 个 对 象 , 都 具有 一 个 确定 的 修改 顺序 (modification order), 它 是 由 来 
自 程序 中 的 所 有 线程 的 对 该 对 象 的 所 有 写 人 组 成 的 ， 由 对 象 的 初始 化 开始 。 在 多 数 情 况 
下 ， 该 顺序 在 每 次 运行 之 间 都 有 所 不 同 ， 但 是 在 任意 给 定 的 程序 执行 里 ， 系 统 中 的 所 有 
线程 必须 一 致 同意 此 顺序 。 如 果 问 题 中 的 对 象 不 是 如 5.2 节 所 述 的 原子 类 型 之 一 ， 你 就 
得 负责 确认 有 足够 的 同步 ， 来 确保 线程 一 致 同意 每 个 变量 的 修改 顺序 。 如 果 不 同 的 线程 
看 到 的 是 一 个 变量 的 不 同 的 顺序 值 ， 就 会 有 数据 竞争 和 未 定义 行为 (参见 5.1.2 节 )。 如 
果 使 用 原子 操作 ， 编 译 器 将 负责 确保 必要 的 同步 已 就 位 。 

这 一 要 求 意味 着 某 些 投机 性 的 执行 是 禁止 的 ， 因为 一 旦 线程 已 在 修改 顺序 中 看 到 了 
某 个 特定 项 ， 则 后 续 读 取 操 作 必须 返回 更 晚 的 值 ， 同 时 来 自 该 线程 对 此 对 象 后 续 的 写 人 
操作 在 修改 顺序 中 也 必须 发 生得 更 晚 。 同 样 ， 在 同一 线程 中 ， 在 对 象 的 写 操作 之 后 的 读 
取 ， 就 必须 返回 要 么 写 入 的 值 ， 要 么 在 该 对 象 的 修改 顺序 中 更 晚 发 生 的 另 一 个 值 。 尽 管 
所 有 的 线程 都 必须 一 致 同意 程序 中 每 一 个 独立 对 象 的 修改 顺序 , 但 却 不 必 一 致 同意 不 同 
对 象 上 操作 的 相对 顺序 。 参见 5.3.3 节 更 多 地 了 人 解 线程 间 的 操作 顺序 。 

那么 ， 是 什么 构成 了 原子 操作 ， 它 又 是 如 何 用 来 强制 顺序 的 ? 


C++ 中 的 原子 操作 及 类 型 


原子 操作 (atomic operation) 是 一 个 不 可 分 割 的 操作 。 从 系统 中 的 任何 一 个 线程 中 ， 
你 都 无 法 观察 到 一 个 完成 到 一 半 的 这 种 操作 ， 它 要 么 做 完了 ， 要 么 就 没 做 完 。 如 果 读 取 
对 象 值 的 载 人 操作 是 原子 的 (atomic)， 并 且 所 有 对 该 对 象 的 修改 也 都 是 原子 的 ， 那 么 
这 个 载 人 操作 所 获取 到 的 要 么 是 对 象 的 初始 值 ， 要 么 是 被 某 个 修改 者 存储 后 的 值 。 

其 对 立 面 ， 是 一 个 非 原子 操作 可 能 被 另 一 个 线程 视 为 半 完 成 的 。 如 果 这 是 一 次 存储 
操作 ， 那 么 被 另 一 个 线程 观察 到 的 值 可 能 既 不 是 储存 前 的 值 也 不 是 已 存储 的 值 ， 而 是 其 
他 的 东西 。 如 果 执 行 非 原子 的 载 人 操作 ， 那 么 它 可 能 获取 对 象 的 一 部 分 ， 由 另 一 个 线程 
修改 了 值 ， 然 后 再 获取 其 余 的 对 象 ， 这 样 获取 到 的 既 不 是 第 一 个 值 也 不 是 第 二 个 值 ， 而 
是 两 者 的 某 种 组 合 。 这 就 是 一 个 简单 的 有 问题 的 竞争 条 件 ， 正 如 第 3 章 所 述 的 那样 ， 但 
是 在 这 个 级 别 ， 它 可 能 构成 一 个 数据 竞争 (参见 5.1 节 ) 并 因而 导致 未 定义 行为 。 
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在 C++ 中 ， 大 多 数 情况 下 需要 通过 原子 类 型 来 得 到 原子 操作 ， 让 我 们 来 看 一 看 。 


5.2.1 标准 原子 类 型 


标准 原子 类 型 可 以 在 <atomic> 头 文件 中 找到 。 在 这 种 类 型 上 的 所 有 操作 都 是 原子 
的 ， 在 语言 定义 的 意义 上 说 ， 只 有 在 这 些 类 型 上 的 操作 是 原子 的 ， 虽然 你 可 以 利用 互 斥 
元 使 得 其 他 操作 看 起 来 像 原子 的 。 事 实 上 ， 标 准 原子 类 型 本 身 就 可 以 进行 这 样 的 模拟 ， 
它们 ULE) 都 具有 一 个 is lock free O 成 员 函 数 ， 让 用 户 决定 在 给 定 类 型 上 的 操 
作 是 否 直 接 用 原子 指令 完成 (x.is lock free() 返 回 true), MAE Hirka 
和 类 库 内 部 的 锁 来 完成 (x.is lock free() 返 回 false)。 

唯一 不 提供 is lock free () 成 员 函 数 的 类 型 是 std: :atomic_flag, 该 类 型 是 
一 个 非常 简单 的 布尔 标识 ， 并 且 在 这 个 类 型 上 的 操作 要 求 是 无 锁 的 。 一 且 你 有 了 一 个 简 
单 的 无 锁 布 尔 标志 ， 就 可 以 用 它 来 实现 一 个 简单 的 锁 ， 从 而 以 此 为 基础 实现 所 有 其 他 的 
原子 类 型 。 当 我 说 非常 简单 时 ， 指 的 是 : 类 型 为 std: :atomic flag 的 对 象 被 初始 化 
为 清除 ， 接 下 来 ， 它 们 可 以 被 查询 和 设置 (通过 test and set O 成员 函数 ) 或 者 清 
We (通过 clear () 成 员 函 数 ) 。 就 是 这 样 : 没有 赋值 ， 没 有 拷贝 构造 函数 ， 没 有 测试 和 
清除 ， 也 没有 任何 其 他 的 操作 。 

其 余 的 原子 类 型 全 都 是 通过 std: :atomic<> 类 模板 的 特 化 来 访问 的 , 并 且 有 一 点 
更 加 的 全 功能 ， 但 可 能 不 是 无 锁 的 〈 如 前 所 述 ) 。 在 大 多 数 流行 的 平台 上 ， 我 们 认为 内 
置 类 型 的 原子 变种 (例如 std: :atomic<int> 和 std: :atomic«void*») 确实 是 无 
锁 的 ， 但 却 并 非 是 要 求 的 。 你 马上 会 看 到 ， 每 个 特 化 的 接口 反映 了 类 型 的 属性 。 例 如 ， 
像 &= 这 样 的 位 操作 没有 为 普通 指针 作 定 义 ， 因 此 它们 也 没有 为 原子 指针 作 定 义 。 

除了 可 以 直接 使 用 std: :atomic<>， 你 还 可 以 使 用 表 5.1 所 示 的 一 组 名 称 ， 来 提 
及 已 经 提供 实现 的 原子 类 型 。 鉴 于 原子 类 型 如 何 被 添加 到 C++ 标准 的 历史 ， 这 些 蔡 代 类 
型 名 称 可 能 指 的 是 相应 的 std: :atomic<> 特 化 , 也 可 能 是 该 特 化 的 基 类 。 在 同一 个 程 
序 中 混用 这 些 替 代 名 称 和 std: :atomic<> 特 化 的 直接 命名 , 可 能 会 因此 导致 不 可 移植 
的 代码 。 


表 5.1 标准 原子 类 型 的 替代 名 称 和 它们 所 对 应 的 std::atomic<> 特 化 


atomic_bool std::atomic«bool» 

atomic char std::atomic<char> 
atomic_schar std::atomic<signed char» 
atomic_uchar std::atomic<unsigned char> 
atomic_int std::atomic<int> 
atomic_uint std::atomic<unsigned> 


atomic_short std::atomic<short> 
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续 表 
atomic_ushort std::atomic<unsigned short> 
atomic_long std::atomic<long> 
atomic_ulong std::atomic<unsigned long> 
atomic_llong std::atomic<long long» 
atomic_ullong std::atomic<unsigned long long> 
atomic char16 t std::atomic«char16 t» 
atomic char32 t Std::atomic«char32 t» 
atomic wchar t std::atomic«wchar t» 


同 基本 原子 类 型 一 样 ，C++ 标 准 库 也 为 原子 类 型 提供 了 一 组 typedef, 对 应 于 各 种 
像 sta: :size_t 这 样 的 非 原子 的 标准 库 typedef， 如 表 5.2 所 示 。 


R52 ”标准 库 原子 类 型 定义 以 及 其 对 应 的 内 置 类 型 定义 


atomic int least8 t int least8 t 


atomic uint least8 t uint least8 t 
atomic int least16 t int least16 t 
atomic uint least16 t uint least16 t 
atomic int least32 t int least32 t 
atomic uint least32 t uint least32 t 
atomic int least64 t int least64 t 
atomic uint least64 t uint least64 t 
atomic int fast8 t int fast8 t 
atomic uint fast8 t uint fast8 t 
atomic int fast16 t int fast16 t 
atomic uint fast16 t uint fast16 t 
atomic int fast32 t int fast32 t 
atomic uint fast32 t uint fast32 t 
atomic int fast64 t int fast64 t 
atomic uint fast64 t uint fast64 t 
atomic intptr t intptr t 
atomic. uintptr t uintptr t 
atomic size t size t 

atomic ptrdiff t ptrdiff t 


atomic intmax t intmax t 
atomic uintmax t | uintmax t 
好 多 的 类 型 啊 ! 有 一 个 很 简单 的 模式 ， 对 于 标准 的 typedef T， 其 对 应 的 原子 类 
型 与 之 同名 并 带 有 atomic 前 级 : atomic_T。 这 同样 适用 于 内 置 类 型 , 区 别 是 signed 
MAAS, unsigned 缩写 为 u，long long 缩写 为 11ong。 一 般 来 说 ， 无 论 你 要 使 
用 的 是 什么 T， 都 只 是 简单 地 说 std: :atomic<T>， 而 不 是 使 用 蔡 代 名 称 。 
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传统 意义 上 ， 标 准 原子 类 型 是 不 可 复制 且 不 可 赋值 的 ， 因 为 它们 没有 拷贝 构造 函数 
和 拷贝 赋值 运算 符 。 但 是 , 它们 确实 支持 从 相应 的 内 置 类 型 的 赋值 进行 隐 式 转换 并 赋值 ， 
与 直接 load() 和 store () 成 员 函 数 、exchange () compare exchange weak() 
以 及 compare exchange strong () 一 样 。 它 们 在 适当 的 地 方 还 支持 复合 赋值 运算 
Rie, +=、 一 、*=、 上 FF 等， 同时 整 型 和 针对 指针 的 std: :atomic<> 特 化 还 支持 ++ 和 --。 这 
些 运算 符 也 拥有 相应 命名 的 具有 相同 功能 的 成 员 函 数 : fetch add, fetch or () 等 。 
赋值 运算 和 成 员 函 数 的 返回 值 既 可 以 是 存储 的 值 (在 赋值 运算 符 的 情况 下 ) 或 运算 之 前 的 
值 (在 命名 函数 的 情况 下 ) 。 这 避免 了 可 能 出 现 的 问题 ， 这 些 问题 源 于 这 种 赋值 运算 符 通常 
会 返回 一 个 将 要 赋值 的 对 象 的 引用 。 为 了 从 这 种 引用 中 获取 存储 的 值 ， 代 码 就 得 执行 独立 的 
读 操 作 ， 这 就 允许 另 一 个 线程 在 赋值 运算 和 读 操 作 之 间 修改 其 值 ， 并 为 竞争 条 件 敞开 大 门 。 
= Ai, std: :atomic<> 类 模板 并 不 仅仅 是 一 组 特 化 。 它 具有 一 个 主 模板 ， 可 以 用 
于 创建 一 个 用 户 定 义 类 型 的 原子 变种 。 由 于 它 是 一 个 泛 型 类 模板 , 操作 只 限 为 10ad () 、 
store() (和 与 用 户 定义 类 型 间 的 相互 赋值 ) exchange () compare exchange. 
weak() 和 compare exchange strong(), 
在 原子 类 型 上 的 每 一 个 操作 均 具有 一 个 可 选 的 内 存 顺 序 参 数 , 它 可 以 用 来 指定 所 需 
的 内 存 顺 序 语义 。 内 存 顺 序 选项 的 确切 语义 参见 5.3 节 。 就 目前 而 言 ， 了 解 运 算 分 为 三 
种 类 型 就 足够 了 。 
m 74% (store) 操作， 可 以 包括 memory order relaxed, memory order. 
release Ä memory order seq cst 顺序 
B AX (load) 操作 ， 可 以 包括 memory order relaxed, memory order. 
consume, memory order acquire A memory order seq cst 顺序 
m 读 - 修 改 - 写 (read-modify-write) 操作 ， 可 以 包括 memory order relaxed, 
memory order consume, memory order acquire, memory order - 
release, memory order acq rel %& memory order seq cst 顺序 
所 有 操作 的 默认 顺序 为 memory_ order seq cst, 
现在 让 我 们 来 看 看 能 够 在 标准 原子 类 型 上 进行 的 实际 操作 ， 从 stád::atomic. 
flag 开始 。 


5.2.2 std::atomic flag 上 的 操作 


std::atomic flag 是 最 简单 的 标准 原子 类 型 ， 它 代表 一 个 布尔 标志 。 这 一 类 型 
的 对 象 可 以 是 两 种 状态 之 一 : 设置 或 清除 。 这 是 故意 为 之 的 基础 ， 仅 仅 是 为 了 用 作 构 造 
块 。 基 于 此 ， 除 非 在 极 特殊 情况 下 ， 和 否则 我 都 不 希望 看 到 使 用 它 。 即 便 如 此 ， 它 将 作为 
讨论 其 他 原子 类 型 的 起 点 ， 因 为 它 展示 了 一 些 应 用 于 原子 类 型 的 通用 策略 。 

类 型 为 std: :atomic flag 的 对 象 必须 用 ATOMIC FLAG INIT 初始 化 。 这 会 将 
该 标志 初始 化 为 清除 状态 。 在 这 里 没有 其 他 的 选择 ， 此 标志 总 是 以 清除 开始 。 
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Std::atomic flag f-ATOMIC FLAG INIT; 


这 适用 于 所 有 对 象 被 声明 的 地 方 ， 且 无 论 其 具有 什么 作用 域 。 这 是 唯一 需要 针对 初 
始 化 进行 特殊 处 理 的 原子 类 型 ， 但 同时 也 是 唯一 保证 无 锁 的 类 型 。 如 果 
std::atomic flag 对 象 具有 状态 存储 持续 时 间 ， 那 么 就 保证 了 静态 初始 化 ， 这 意味 
着 不 存在 初始 化 顺序 问题 ， 它 总 是 在 该 标识 上 的 首次 操作 时 进行 初始 化 。 

一 且 标 识 对 象 初始 化 完成 ， 你 只 能 对 它 做 三 件 事 : 销毁 、 清 除 或 设置 并 查询 其 先前 
的 值 。 这 些 分 别 对 应 于 析 构 函数 、clear O 成 员 函 数 以 及 test _ and set () 成 员 函 数 。 
clear () 和 test_and_set() 成 员 函 数 都 可 以 指定 一 个 内 存 顺 序 。clear () 是 一 个 存 
储 操作 ， 因 此 不 能 有 memory order acquire 或 memory order acq rel 语义 ， 
但 是 test and set () 是 一 个 读 - 修 改 - 写 操 作 ， 并 因此 能 够 适用 任意 的 内 存 顺序 标签 。 
至 于 每 个 原子 操作 ， 其 默认 值 都 是 memory_order_seq_cst。 例如 ， 


f.clear(std::memory order release); +@ 
bool x-f.test and set(); 


此 处 ， 对 clear () 的 调用 @ 明 确 要 求 使 用 释放 语义 清除 该 标志 ， 而 对 test and. 
set () 的 调用 @ 使 用 默认 内 存 顺序 来 设置 标志 和 获取 旧 的 值 。 

你 不 能 从 一 个 std::atomic flag 对 象 拷贝 构造 另 一 个 对 象 ， 也 不 能 将 一 个 
std::atomic flag 赋值 给 另外 一 个 。 这 并 不 是 std::atomic flag 特有 的 ， 而 是 
所 有 原子 类 型 共有 的 。 在 原子 类 型 上 的 操作 全 都 定义 为 原子 的 ， 以 及 包括 两 个 对 象 的 赋 
值 和 拷贝 构造 。 在 两 个 不 同 对象 上 的 单一 操作 不 可 能 是 原子 的 。 在 拷贝 构造 或 拷贝 赋值 
的 情况 下 ， 其 值 必须 先 从 一 个 对 象 读 取 ， 再 写 人 另外 一 个 。 这 是 在 两 个 独立 对 象 上 的 独 
立 操作 ， 其 组 合 不 可 能 是 原子 的 。 因 此 ， 这 些 操作 是 禁止 的 。 

有 限 的 特性 集 使 得 std: :atomic_flag 理想 地 适合 于 用 作 自 旋 锁 互 斥 元 。 最 开始 ， 
该 标志 置 为 清除 ， 互 斥 元 是 解锁 的 。 为 了 锁定 互 斥 元 ， 循 环 执行 test and set () 直 
至 旧 值 为 false， 指 示 这 个 线程 将 值 设 为 true。 解 锁 此 互 斥 元 就 是 简单 地 清除 标志 。 
这 个 实现 展示 在 清单 5.1 中 。 


清单 5.1 使 用 std::atomic flag 的 自 旋 锁 互 斥 实现 


class spinlock mutex 


Std::atomic flag flag; 
public: 
Spinlock mutex(): 
flag(ATOMIC FLAG INIT) 
{} 


void lock() 


while(flag.test and set(std::memory order acquire)); 


) 
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void unlock() 


{ 
} 


flag.clear (std: :memory_order_release) ; 


Fi 

这 样 一 个 互 斥 元 是 非常 基本 的 ， 但 它 足 以 与 std: :lock_guard<> 一 同 使 用 ( 参 
见 第 3 章 ) 。 就 其 本 质 而 言 ， 它 在 lock O 中 执行 了 一 个 忙 等 待 ， 因此 如 果 你 希望 有 任 
何 程度 的 竞争 ,这 就 是 个 糟糕 的 选择 , 但 它 足 以 确保 互 斥 。 当 我 们 观察 内 存 顺序 语义 时 ， 
将 看 到 这 是 如 何 保证 与 互 斥 元 锁 相 关 的 必要 的 强制 顺序 。 这 个 例子 将 在 5.3.6 节 中 阐述 。 

std: :atomic flag 由 于 限制 性 甚至 不 能 用 作 一 个 通用 的 布尔 标识 ， 因 为 它 不 具 
有 简单 的 无 修改 查询 操作 。 为 此 ， 你 最 好 还 是 使 用 std: :atomic<bool>， 接 下 来 我 
将 介绍 之 。 


5.23 基于 std::atomic<bool> 的 操作 


最 基本 的 原子 整数 类 型 是 std: :atomic<boo1>。 如 你 所 期 望 那样 ， 这 是 一 小 比 
std::atomic flag 功能 更 全 的 布尔 标志 。 虽然 它 仍然 是 不 可 拷贝 构造 和 拷贝 赋值 的 ， 
但 可 以 从 一 个 非 原子 的 bool 来 构造 它 ， 所 以 它 可 以 被 初始 化 为 true 或 false， 同时 
也 可 以 从 一 个 非 原子 的 pool 值 来 对 std: :atomic<bool> 的 实例 赋值 。 


std::atomic<bool> b(true); 
b=false; 


从 非 原子 的 pool 进行 赋值 操作 还 要 注意 的 一 件 事 是 它 与 通常 的 惯例 不 同 ， 并 非 向 
其 赋值 的 对 象 返回 一 个 引用 ， 它 返回 的 是 具有 所 赋值 的 bool, 这 对 于 原子 类 型 是 另 一 
种 常见 的 模式 , 它们 所 支持 的 赋值 操作 符 返 回 值 (属于 相应 的 非 原子 类 型 ) 而 不 是 引用 。 
如 果 返 回 的 是 原子 变量 的 引用 ， 所 有 依赖 于 赋值 结果 的 代码 将 显 式 地 载 人 该 值 ， 可 能 会 
获取 被 另 一 线程 修改 的 结果 。 通过 以 非 原 子 值 的 形式 返回 赋值 结果 ， 可 以 避免 这 种 额外 
的 载 和 人， 你 会 知道 所 获取 到 的 值 是 已 存储 的 实际 值 。 

与 使 用 std::atomic flag 的 受 限 的 clear () 函数 不 同 ， 写 操作 (无 论 是 true 
还 是 false) 是 通过 调用 store () 来 完成 的 。 类 似 地 ， test and set () 被 更 通用 的 
exchange () WR RURE, 它 可 以 让 你 用 所 选择 的 新 值 来 代替 已 存储 的 值 ， 同 时 获 
RR. std: :atomic<bool> 支 持 对 值 的 普通 无 修改 查询 ， 通 过 隐 式 转化 成 普通 的 
bool, 或 显 式 调用 load () 。 正 如 你 所 期 望 的 ，store () 是 一 个 存储 操作 ,而 load () 
是 载 人 操作 ，exchange () 是 读 -修改 - 写 操作 。 


std::atomic«bool» b; 

bool x-b.load(std::memory order acquire); 
b.store (true); 

x-b.exchange (false,std::memory order acq rel); 


exchange () Jf 3E std: :atomic<bool> 支 持 的 唯一 的 读 - 修 改 - 写 操作 , 它 还 引入 


106 第 5 章 C++ 内 存 模型 和 原子 类 型 上 操作 


了 一 个 操作 ， 用 于 在 当前 值 与 期 望 值 相等 时 ， 存 储 新 的 值 。 
根据 当前 值 存储 一 个 新 值 〈 或 者 否 ) 


这 个 新 的 操作 被 称 为 比较 /交换 ， 它 以 compare exchange weak() 和 
compare exchange strong () 成 员 函 数 形式 出 现 。 比 较 /交换 操作 是 使 用 原子 类 型 纺 
程 的 基石 , 它 比较 原子 变量 值 和 所 提供 的 期 望 值 , 如 果 两 者 相等 , 则 存储 提供 的 期 望 值 。 
如 果 两 者 不 等 , 则 期 望 值 更 新 为 原子 变量 的 实际 值 。 比较/ 交换 函数 的 返回 类 型 为 bool , 
如 果 执 行 了 存储 即 为 true， 反 之 则 为 false。 

对 于 compare exchange weak(), ， 即 使 原始 值 等 于 期 望 值 也 可 能 出 现存 储 不 成 
功 ， 在 这 种 情况 下 变量 的 值 是 不 变 的 ，compare_exchange weak () 的 返回 值 为 
false。 这 最 有 可 能 发 生 在 缺少 单个 的 比较 并 交换 指令 的 机 器 上 ， 此 时 处 理 器 无 法 保证 
该 操作 被 完成 一 一 可 能 因为 执行 操作 的 线程 在 必需 的 指令 序列 中 间 被 切换 出 来 , 同时 在 
线程 多 余 处 理 器 数量 的 操作 系统 中 ， 它 被 另 一 个 计划 中 的 线程 代替 。 这 就 是 所 谓 的 伪 失 
J& (spurious failure)， 因 为 失败 的 原因 是 时 间 的 函数 而 不 是 变量 的 值 。 

由 于 compare exchange weak () 可 能 会 伪 失 败 ， 它 通常 必须 用 在 循环 中 。 


bool expected-false; 
extern atomic«bool» b; // 在 别处 设置 
while(!b.compare exchange weak(expected,true) && !expected); 


在 这 种 情况 下 , 只 要 expected {hJ false, 表明 compare exchange weak() 
调用 伪 失败 ， 就 保持 循环 。 

另 一 方面 ， 仅 当 实 际 值 不 等 于 expected 值 时 compare exchange strong () 
才 保证 返回 false, 这样 可 以 消除 对 循环 的 需求 ， 正 如 你 希望 知道 它 所 显示 的 那样 ,是 
否 成 功 改变 了 一 个 变量 ， 或 者 是 否 有 另 一 个 线程 抢先 抵达 。 

如 果 你 想 要 改变 变量 ， 无 论 其 初始 值 是 多 少 (也 许 是 用 一 个 依赖 于 当前 值 的 更 新 
值 )，expected 的 更 新 就 变 得 很 有 用 ， 每 次 经 过 循环 时 ，expected 被 重新 载 人 ， 因 
此 如 果 没 有 其 他 线程 在 此 期 间 修改 其 值 ， 那 么 compare_exchange_weak () 或 
compare exchange strong () 的 调用 在 下 一 次 循环 中 应 该 是 成 功 的 。 如 果 计 算 待 存 
储 的 值 很 简单 ， 为 了 避免 在 compare exchange weak () 可 能 会 伪 失 败 的 平台 上 的 双 
Hh, (T Æ compare exchange strong O 包含 一 个 循环 ) Ju fk JH 
compare exchange weak () 可 能 是 有 好 处 的 。 另 一 方面 ， 如 果 计 算 待 存储 的 值 本 身 
是 耗 时 的 ， 当 expected 值 没有 变化 时 , 使 用 compare exchange strong () 来 避 
免 被 迫 重新 计算 待 存 储 的 值 可 能 是 有 意义 的 。 对 于 std: :atomic<bool> 而 言 这 并 不 
重要 一 一 毕竟 只 有 两 个 可 能 的 值 一 一 但 对 于 较 大 的 原子 类 型 这 会 有 所 不 同 。 

比较 /交换 函数 还 有 一 点 非 同 寻 常 , 它们 可 以 接受 两 个 内 存 顺 序 参 数 。 这 就 允许 内 存 
顺序 的 语义 在 成 功 和 失败 的 情况 下 有 所 区 别 。 对 于 一 次 成 功 调用 具有 
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memory order acq rel 语义 而 一 次 失败 的 调用 有 着 memory order relaxed 语 
义 ， 这 想必 是 极 好 的 。 一 次 失败 的 比较 /交换 并 不 进行 存储 ， 因 此 它 无 法 具有 
memory order release Bk memory order acq rel 语义 。 因 此 在 失败 时 , 禁止 提 
供 这 些 值 作为 顺序 。 你 也 不 应 为 失败 提供 比 成 功 更 严格 的 内 存 顺序 。 如 果 你 希望 
memory order acquire 或 者 memory order seq cst 作为 失败 的 语义 ,你 也 必须 
为 成 功 指定 这 些 语义 。 

如 果 你 没有 为 失败 指定 一 个 顺序 ， 就 会 假定 它 与 成 功 是 相同 的 ， 除 了 顺序 的 
release 部 分 被 除去 : memory order release BR memory order relaxed, 
memory order acq rel Æ memory order acquire, 如 果 你 都 没有 指定 ， 它 们 
通常 默认 为 memory_order _seq_cst， 这 为 成 功 和 失败 都 提供 了 完整 的 序列 顺序 。 以 
下 对 compare exchange weak () 的 两 个 调用 是 等 价 的 。 


std::atomic<bool> b; 
bool expected; 
b.compare exchange weak (expected, true, 
memory order acq rel,memory order acquire); 
b.compare exchange weak(expected,true,memory order acq rel); 


我 将 把 选择 内 存 顺 序 的 后 果 留 在 5.3 5. 

std: :atomic<bool> 和 std: :atomic flag 之 间 的 另外 一 个 区 别 是 std: :atomic 
<bool> 可 能 不 是 无 锁 的 。 为 了 保证 操作 的 原子 性 ， 实 现 可 能 需要 内 部 地 获得 一 个 互 斥 锁 。 
对 于 这 种 罕见 的 情况 ， 当 它 重 要 时 ， 你 可 以 使 用 is lock free () 成 员 函 数 检查 是 否 对 
std: :atomic<bool> 的 操作 是 无 锁 的 。 除 了 std::atomic flag, 对 于 所 有 原子 类 型 ， 
这 是 另 一 个 特征 共同 。 

原子 类 型 中 其 次 简单 的 是 原子 指针 特 化 std: :atomic<T*>, 那么 接 下 来 我 们 看 看 
这 
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5.24 std::atomic<T*> 上 的 操作 : 指针 算术 运算 


对 于 某 种 类 型 T 的 指针 的 原子 形式 是 std: :atomic<T*>, 正 如 bool 的 原子 形式 
是 std: :atomic<bool> 一 样 。 接 口 基本 上 是 相同 的 ， 只 不 过 它 对 相应 的 指针 类 型 的 
值 进 行 操作 而 非 bool 值 。 与 std: :atomic<bool> 一 样 ， 它 既 不 能 拷贝 构造 ， 也 不 
能 拷贝 赋值 ， 虽 然 它 可 以 从 合适 的 指针 值 中 构造 和 赋值 。 和 必须 的 is_lock_free () 
成 员 函 数 一 样 ，stq: :atomic<Tx> 也 有 1oad(), store(), exchange () 、 
compare exchange weak () il compare exchange strong () 成 员 函 数 ， 具有 和 
std::atomic<bool> 相 似 的 语义 ， 也 是 接受 和 返回 T* 而 不 是 bool, 

std: :atomic<Tx> 提 供 的 新 操作 是 指针 算术 运算 。 这 种 基本 的 操作 是 由 
fetch add () 和 fetch sub () 成 员 函 数 提供 的 , 可 以 在 所 存储 的 地 址 上 进行 原子 加 法 
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和 减法 ，+=、-=、 带 ++ 和 -- 的 前 级 与 后 级 的 自 增 自 减 等 运算 符 ， 都 提供 了 方便 的 封装 。 
运算 符 的 工作 方式 , 与 你 从 内 置 类 型 中 所 期 待 的 一 样 。 如 果 x 是 std: :atomic<Foo*> 
指向 Foo 对 象 数组 的 第 一 项 , 那么 x+=3 将 它 改 为 指向 第 四 项 , 并 返回 一 个 普通 的 指向 
第 四 项 的 Foo*。fetch add() 和 fetch sub () 有 细微 的 区 别 , 它们 返回 的 是 原 值 (所 
以 x.fetch add(3) 将 x 更 新 为 指向 第 四 个 值 ， 但 是 返回 一 个 指向 数组 中 的 第 一 个 值 
的 指针 ) 。 该 操作 也 称 为 交换 与 添加 , 它 是 一 个 原子 的 读 -修改 - 写 操作 ,就 像 exchange () 
和 compare exchange weak()/compare exchange strong()。 与 其 他 的 操作 一 
样 ， 返 回 值 是 一 个 普通 的 T* 值 而 不 是 对 std: :atomic<T*> 对 象 的 引用 ， 因 此 ， 调 用 
代码 可 以 基于 之 前 的 值 执行 操作 。 


class Foo(); 
Foo some array[5]; 


Std::atomic«Foo*» p(some array); *f p Jl 2 并 返回 
Foo* x-p.fetch add(2); 原来 的 值 
assert(x--some array); 

assert (p.load()==&some_array [2] ) ; 

es Pd 将 p 减 1 并 返回 
assert(x--&some array[1]); 

assert (p.load()--&some array[1]); 新 的 值 


该 函数 形式 也 允许 内 存 顺 序 语义 作为 一 个 额外 的 函数 调用 参数 而 被 指定 。 
p.fetch add(3,std::memory order release); 


因为 fetch add () fl fetch sub () 都 是 读 -修改 - 写 操作 , 所 以 它们 可 以 具有 任意 
的 内 存 顺 序 标签 , 也 可 以 参与 到 释放 序列 中 。 对 于 运算 形式 , 指定 顺序 语义 是 不 可 能 的 ， 
因为 没有 办 法 提供 信息 ， 因 此 这 些 形式 总 是 具有 memory order seq cst 语义 。 

其 余 的 基本 原子 类 型 本 质 上 都 是 一 样 的 ， 它 们 都 是 原子 整 型 ， 并 且 彼 此 都 具有 相同 
的 接口 ， 区 别 是 相关 联 的 内 置 类 型 是 不 同 的 。 我 们 将 它们 视 为 一 个 群 组 。 


5.2.5 ”标准 原子 整 型 的 操作 


除了 一 组 通常 的 操作 (load()、store()、exchange()、compare exchange 
weak() 和 compare exchange strong()) 之 外 , 像 std: :atomic<int> 或 者 
std::atomic«unsigned long long> 这 样 的 原子 整 型 还 有 相当 广泛 的 一 组 操作 可 
IH: fetch add(), fetch sub(), fetch and(), fetch or(), fetch xor(), 
这 些 运算 的 复合 赋值 形式 (+=、-=、&=、|= 和 ^=) , MAER EURURTRI AU we (++ 
x++、--X 和 x--)。 这 并 不 是 很 完整 的 一 组 可 以 在 普通 的 整 型 上 进行 的 复合 赋值 运算 ， 
但 是 已 足够 接近 了 ， 只 有 除法 、 乘 法 和 位 移 运算 符 是 缺失 的 。 因 为 原子 整 型 值 通常 作为 
计数 器 或 者 位 掩 码 来 使 用 ， 这 不 是 一 个 特别 明显 的 损失 。 如 果 需 要 的 话 ， 额 外 的 操作 可 
以 通过 在 一 个 循环 中 使 用 compare exchange weak () 来 实现 。 
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这 些 语义 和 std: :atémic<T*> 的 fetch adqd() 和 fetch_sub() 的 语义 密切 
地 匹配 ， 命 名 函数 原子 级 执行 它们 的 操作 ， 并 返回 旧 值 ， 而 复合 赋值 运算 符 返 回 新 
值 。 前 级 与 后 级 自 增 自 减 也 跟 平常 一 样 工作 ，++x 增加 变量 值 并 返回 新 值 ， 而 x++ 
增加 变量 并 返回 旧 值 。 正 如 你 到 目前 所 期 待 的 那样 ， 在 这 两 种 情况 下 ， 结 果 都 是 一 
个 相关 联 的 整 型 值 。 

现在 , 我 们 已 经 了 解 了 所 有 的 基本 原子 类 型 ， 剩 下 的 就 是 泛 型 std: :atomic<> 初 
级 类 模板 而 不 是 这 些 特 化 ， 那 么 让 我 们 接着 看 下 面 的 内 容 。 


5.2.6 ”std::atomic<> 初 级 类 模板 


除了 标准 的 原子 类 型 ， 初 级 模板 的 存在 允许 用 户 创建 一 个 用 户 定义 的 类 型 的 原 
子 变种 。 然 而 ， 你 不 能 只 是 将 用 户 定义 类 型 用 于 std: :atomic<>， 该 类 型 必须 满 
足 一 定 的 准则 。 为 了 对 用 户 定义 类 型 UDT 使 用 std: :atomic<UDT>， 这 种 类 型 必 
须 有 一 个 平凡 的 (trivial) 拷贝 赋值 运算 符 。 这 意味 着 该 类 型 不 得 拥有 任何 虚 函 数 或 
虚 基 类 ， 并 且 必 须 使 用 编译 器 生成 的 拷贝 赋值 运算 符 。 不 仅 如 此 ， 一 个 用 户 定义 类 
型 的 每 个 基 类 和 非 静 态 数据 成 员 也 都 必须 有 一 个 平凡 的 拷贝 赋值 运算 符 。 这 实质 上 
人 允许 编译 器 将 memcpy () 或 一 个 等 价 的 操作 用 于 赋值 操作 ， 因 为 没有 用 户 编写 的 代 
码 要 运行 。 

最 后 ,该 类 型 必须 是 按 位 相等 可 比较 的 。 这 伴随 着 赋值 的 要 求 ， 你 不 仅 要 能 够 使 用 
memcpy () 复制 UDT 类 型 的 对 象 ， 而 且 还 必须 能 够 使 用 memcmp () 比较 实例 是 否 相等 。 
为 了 使 比较 /交换 操作 能 够 工作 ， 这 个 保证 是 必需 的 。 

这 些 限 制 的 原因 可 以 追溯 到 第 3 章 中 的 一 个 准则 ， 不 要 在 锁定 范围 之 外 ， 向 受 保 
护 的 数据 通过 将 其 作为 参数 传递 给 用 户 所 提供 的 函数 的 方式 ， 传 递 指针 和 引用 。 一 般 
情况 下 ， 编 译 器 无 法 为 std: :atomic<UDT> 生 成 无 锁 代 码 ， 所 以 它 必须 对 所 有 的 操 
作 使 用 一 个 内 部 锁 。 如 果 用 户 提供 的 拷贝 赋值 或 比较 运算 符 是 被 允许 的 ， 这 将 需要 传 
递 一 个 受 保护 数据 的 引用 作为 一 个 用 户 提供 的 函数 的 参数 ， 因 而 违背 准则 。 同 样 地 ， 
类 库 完 全 自由 地 为 所 有 需要 单个 锁定 的 原子 操作 使 用 单个 锁定 ， 并 允许 用 户 提供 的 函 
数 被 调用 ， 虽 然 认为 因为 一 个 比较 操作 花 了 很 长 时 间 ， 该 锁 可 能 会 导致 死 锁 或 造成 其 
他 线程 阻塞 。 最 后 ， 这 些 限 制 增加 了 编译 器 能 够 直接 为 std: :atomic<UDT> 利 用 原 
子 指令 的 机 会 (并 因此 使 一 个 特定 的 实例 无 锁 ), 因为 它 可 以 把 用 户 定义 的 类 型 作为 一 
组 原始 字 节 来 处 理 。 

需要 注意 的 是 ， 虽 然 你 可 以 使 用 std: :atomic<float> 或 std::atomic 
«double», 因为 内 置 的 浮 点 类 型 确实 满足 与 memcpy 和 memcmp 一 同 使 用 的 准则 ,在 
compare exchange strong 情况 下 这 种 行为 可 能 会 令 人 惊讶 。 如 果 存 储 的 值 具有 不 
同 的 表示 ， 即 使 旧 的 存储 值 与 被 比较 的 值 的 数值 相等 ， 该 操作 可 能 会 失败 。 请 注意 ， 浮 
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点 值 没有 原子 的 算术 操作 。 如 果 你 使 用 一 个 具有 定义 了 相等 比较 运算 符 的 用 户 定义 类 型 
的 std: :atomic<>, 你 会 得 到 和 compare exchange strong 类 似 的 情况 , MAK 
操作 符 会 与 使 用 memcmp 进行 比较 不 同一 一 该 操作 可 能 因 另 一 相等 值 具有 不 同 的 表示 
而 失败 。 

如 果 你 的 UDT 和 一 个 int 或 一 个 void* 大 小 相同 (或 更 小 )， 大 部 分 常见 的 平台 
能 够 为 std: :atomic<UDT> 使 用 原子 指令 ,一 些 平台 也 能 够 使 用 大 小 是 int gk void* 
两 倍 的 用 户 定义 类 型 的 原子 指令 。 这些 平 台 通 常 支持 一 个 与 compare exchange xxx 
函数 相对 应 的 所 谓 的 双 字 比较 和 交换 (double-word-compare-and-swap，DWCAS) 指 
令 。 正 如 你 将 在 第 7 章 中 看 到 的 ， 这 种 支持 可 以 帮助 写 无 锁 代 码 。 

这 些 限制 意味 着 , 例如 ,你 不 能 创建 一 个 std: :atomic<std: :vector<int>>, 
但 你 可 以 把 它 与 包含 计数 器 、 标识 符 、 指 针 、 甚 至 简单 的 数据 元 素 的 数组 的 类 一 起 使 用 。 
这 不 是 特别 的 问题 。 越 是 复杂 的 数据 结构 ， 你 就 越 有 可 能 想 在 它 之 上 进行 简单 的 赋值 和 
比较 之 外 的 操作 。 如 果 情 况 是 这 样 ,你 最 好 还 是 使 用 std::mutex, 来 确保 所 需 的 操作 
得 到 适当 的 保护 ， 正 如 在 第 3 章 中 所 描述 的 。 

当 使 用 一 个 用 户 定 义 的 类 型 T 进行 实例 化 时 ，std: :atomic<T> 的 接口 被 限制 为 
一 组 操作 , 对 于 std: :atomic<bool>:load()、store()、exchange(),compare_ 
exchange weak(), compare exchange strong()， 以 及 赋值 自 和 转换 到 类 型 T 
的 实例 ， 是 可 用 的 。 

表 5.3 展示 了 在 每 个 原子 类 型 上 的 可 用 操作 。 


R53 原子 类 型 的 可 用 操作 


test and set 
clear 


is lock free v 3 
load v v 
store v v 
exchange v v 
compare exchang e weak, v v 


compare exchange strong 
fetch. add, += 
fetch sub, -= 


fetch or, | 
fetch and, &- 
fetch xor, ^- 


B.E. SS ego S. 


++,- 
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5.2.7 ”原子 操作 的 自由 函数 


到 现在 为 止 ， 我 一 直 限 制 自己 去 描述 原子 类 型 的 操作 的 成 员 函 数 形式 。 然 而 ， 各 种 原 
子 类 型 上 的 所 有 操作 也 都 有 等 效 的 非 成 员 函 数 。 对 于 大 部 分 非 成 员 函 数 来 说 ， 都 是 以 相应 
的 成 员 函 数 来 命名 的 ， 只 是 带 有 一 个 atomic WR (例如 std: :atomic_load() )。 这 
此 函数 也 为 每 个 原子 类 型 进行 了 重 载 。 在 有 机 会 指定 内 存 顺 序 标签 的 地 方 ， 它 们 有 两 个 
变种 ; 一 个 没有 标签 , 一 个 带 有 _explicit 后 缀 和 额外 的 参数 作为 内 存 顺 序 的 标签 ( 例 
"Wl, std::atomic store (&atomic var,new value) 43 std: atomic store. 
explicit (&atomic_var,new_value, std: :memory order release) #HXt). %4 
成 员 函 数 引 用 的 原子 对 象 是 隐 式 的 ,然而 所 有 的 自由 函数 接受 一 个 指 向 原子 对 象 的 指针 
作为 第 一 个 参数 。 

f^, std::atomic is lock free() 只 有 一 个 变种 (尽管 为 每 个 类 型 重 载 )， 
而 std::atomic is lock free(&a) 对 于 原子 类 型 a 的 对 象 ， 与 a.is lock 
free() 返 回 相 同 的 值 。 同 样 地 ，std: :atomic load(&ga) 和 a.load() 是 一 样 的 ， 
但 是 a.load(std::memory order acquire) a m] FF std::atomic load. 
explicit(&a, std: :memory order acquire), 

自由 函数 被 设计 为 可 兼容 C 语言 , 所 以 它们 在 所 有 情况 下 使 用 指针 而 不 是 引用 。 例 
lll, compare exchange weak () 和 compare exchange strong () 成 员 函 数 (期 
望 值 ) 的 第 一 参数 是 引用 ， 而 std: :atomic compare exchange weak () (第 一 个 
参数 是 对 象 指 针 ) 的 第 二 个 参数 是 指针 。std: :atomic compare exchange. 
weak explicit () 同时 也 需要 指定 成 功 与 失败 的 内 存 顺 序 。 而 比较 /交换 成 员 函数 具有 
一 个 单 内 存 顺序 形式 (默认 为 std: :memory order seq cst) 和 一 个 分 别 接受 成 功 
与 失败 内 存 顺序 的 重 载 。 

std: :atomic flag 上 的 操作 违反 这 一 潮流 ， 原 因 在 于 它们 在 名 字 中 拼 出 “flag” 
的 部 分 ; std: :atomic flag test and set ()、 std::atomic flag clear(), 
尽管 指定 内 存 顺 序 的 其 他 变种 具有 _explicit E. std::atomic flag test. 
and set explicit () fl std: :atomic flag clear explicit(), 

C++ 标准 库 还 提供 了 为 了 以 原子 行为 访问 std: :shared_ptr<> 实 例 的 自由 函数 。 
这 打破 了 只 有 原子 类 型 支持 原子 操作 的 原则 ， 因 为 std: :shared_ptr<> 很 肯定 地 不 
是 原子 类 型 。 然 而 ，C++ 标 准 委员 会 认为 提供 这 些 额外 的 函数 是 足够 重要 的 。 可 用 的 原 
子 操作 有 : BA doad), 存储 (store)、 交换 (exchange) 和 比较 /交换 ( compare/exchange)， 
这 些 操作 以 标准 原子 类 型 上 的 相同 操作 的 重 载 的 形式 被 提供 ， 接 受 
std::shared ptr<>* 作 为 第 一 个 参数 。 
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std: :shared ptr<my data> p; 
void process global data() 


{ 
Std::shared ptr«my data» local-std::atomic load(&p); 
process data (local); 


void update global data() 


Std::shared ptr«my data» local(new my data); 
Std::atomic store(&p,local); 


) 


至 于 其 他 类 型 上 的 原子 操作 ，_explicit 变量 也 被 提供 并 允许 你 指定 所 需 的 内 存 顺 
序 ,std: :atomic is_lock_free() 函数 可 以 用 于 检查 是 否 实现 使 用 了 锁 以 确保 原子 性 。 

正如 在 引言 中 所 提 到 的 , 标准 的 原子 类 型 能 做 的 不 仅仅 是 避免 与 数据 竞争 相关 的 未 
定义 行为 ,它们 允许 用 户 在 线程 间 强 制 操作 顺序 。 这 个 强制 的 顺序 是 为 保护 数据 和 诸如 
std: :mutex 和 std: :future<> 这 样 同步 操作 的 工具 的 基础 。 考虑 到 这 一 点 , 让 我 们 
进入 到 本 章 真 正 的 重点 ， 内 存 模型 的 并 发 方面 的 细节 ， 以 及 原子 操作 如 何 用 来 同步 数据 
和 强制 顺序 。 


同步 操作 和 强制 顺序 


假设 有 两 个 线程 ， 其 中 一 个 是 要 填充 由 第 二 个 线程 所 读 取 的 数据 结构 。 为 了 避免 有 
问题 的 竞争 条 件 ， 第 一 个 线程 设置 一 个 标志 来 指示 数据 已 经 就 绪 ， 在 标志 设置 之 前 第 二 
个 线程 不 读 取 数 据 。 清 单 5.2 展示 了 这 样 的 场景 。 


清单 5.2 ”从 不 同 的 线程 中 读 取 和 写 入 变量 


#include <vector> 
#include <atomic> 
#include <iostream> 


std::vector<int> data; 
std::atomic<bool> data_ready (false) ; 


void reader thread() 


{ 


while(!data_ready.load()) <@ 


{ 
} 


Std::cout««"The answer="<<data[0]<<”\n"; +@ 


Std::this thread: :sleep(std::milliseconds (1) ) ; 


void writer thread () 


{ 
data.push_back (42) ; «e 
data ready-true; 


) 
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撤 开 等 待 数据 准备 的 循环 的 低 效率 @ ， 你 确实 需要 这 样 工作 ， 因 为 不 这 样 的 话 在 线 
程 间 共享 数据 就 变 得 不 可 行 ， 每 一 项 数据 都 强制 成 为 原子 的 。 你 已 经 知道 在 没有 强制 顺 
序 的 情况 下 ， 非 原子 的 读 @ 和 写 @ 同 一 个 数据 是 未 定义 的 行为 ， 所 以 为 了 使 其 工作 ， 某 
个 地 方 必须 有 一 个 强制 的 顺序 。 

所 要 求 的 强制 顺序 来 自 于 Std: :atomic<bool> 变 量 data ready 上 的 操作 ， 它 
们 通过 happens-before (发 生 于 之 前 ) 和 synchronizes-with 〈 与 之 同步 ) 内 存 模型 关系 
的 优点 来 提供 必要 的 顺序 。 数据 写 和 信 @ 发 生 于 写 人 data ready 标志 @ 之 前 , 标志 的 读 
取 @ 发 生 于 数据 的 读 取 @ 之 前 。 当 从 data_ready@ 读 取 的 值 为 true 时 ， 写 与 读 同 
步 ， 创 建 一 个 happens-before 的 关系 。 因 为 happens-before 是 可 传递 的 ， 数 据 的 写 人 @ 
发 生 于 标志 的 写 人 @ 之 前 , 发 生 于 从 标志 读 取 crue 值 @ 之 前 , 又 发 生 于 数据 的 读 取 @ 
之 前 ， 你 就 有 了 一 个 强制 顺序 ， 数据 的 写 人 发 生 于 数据 的 读 取 之 前 ， 一 切 都 好 了 。 图 
5.2 表明 了 两 个 线程 间 happens-before 关系 的 重要 性 。 我 从 读 线 程 添 加 了 while 循环 
的 几 次 迭代 。 


| - 
| data ready.load() 

ta. h ck (42 一 

data.push_back (42) | (返回 false) 


data ready.load() 


(返回 false) 


data ready. load() 


(返回 true) 


data[0] 
(返回 42) 


写 线程 | 读 线程 
图 5.2 用 原子 操作 在 非 原子 操作 之 间 强 制 顺 序 
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所 有 这 一 切 都 似乎 相当 直观 ， 写 人 一 个 值 当 然 发 生 在 读 取 这 个 值 之 前 ! 使 用 默认 的 
原子 操作 ， 这 的 确 是 真 的 (这 就 是 为 什么 它 是 默认 的 )， 但 它 需要 阐明 ， 原子 操作 对 于 
顺序 要 求 也 有 其 他 的 选项 ， 这 一 点 我 马上 会 提 到 。 

现在 , 你 已 经 在 实战 中 看 到 了 happens-before 和 synchronizes-with, 现在 是 时 候 来 看 
看 它们 到 底 是 什么 意思 了 。 我 将 从 synchronizes-with 开始 。 


5.3.1 synchronizes-with 关系 


synchronizes-with 关系 是 你 只 能 在 原子 类 型 上 的 操作 之 间 得 到 的 东西 。 如 果 一 个 数 
据 结 构 包 含 原子 类 型 ， 并 且 在 该 数据 结构 上 的 操作 会 在 内 部 执行 适当 的 原子 操作 ,该 数 
据 结 构 上 的 操作 (MBE RIC) 可 能 会 提供 这 种 关系 ， 但 是 从 根本 上 说 
synchronizes-with 关系 只 出 自 原子 类 型 上 的 操作 。 

基本 的 思想 是 这 样 的 : 在 一 个 变量 x 上 的 一 个 被 适当 标记 的 原子 写 操作 W， 与 在 x 
上 的 一 个 被 适当 标记 的 ， 通 过 写 入 (W) ,或 是 由 与 执行 最 初 的 写 操作 W 相同 的 线程 在 x 
上 的 后 续 原子 写 操作 ， 或 是 由 任意 线程 在 x 上 一 系列 的 原子 的 读 -修改 - 写 操作 (如 
fetch add() 或 compare exchange weak()) 来 读 取 所 存储 的 值 的 原子 读 操 作 同 
步 ， 其 中 随后 通过 第 一 个 线程 读 取 的 值 是 通过 W 写 和 的 值 (参见 5.3.4 节 )。 

现在 将 “适当 标记 ”部 分 放 在 一 边 , 因为 原子 类 型 的 所 有 的 操作 是 默认 适当 标记 的 。 
这 基本 上 和 你 想 的 一 样 ， 如 果 线 程 A 存储 一 个 值 而 线程 B 读 取 该 值 ， 那 么 线程 A 中 的 
存储 和 线程 B 中 的 载 人 之 间 存 在 一 种 synchronizes-with 关系 ， 如 清单 5.2 中 一 样 。 

我 敢 肯定 你 已 经 猜 到 ， 微 妙 之 处 尽 在 “适当 标记 ”的 部 分 。C++ 内 存 模型 允许 各 种 
顺序 约束 应 用 于 原子 类 型 上 的 操作 ， 这 就 是 我 所 指 的 标记 。 内 存 顺 序 的 各 种 选项 以 及 它 
们 如 何 涉 及 synchronizes-with 关系 包含 在 5.3.3 节 中 。 让 我 们 退 一 步 来 看 看 happens-before 
关系 。 


5.3.2 happens-before 关系 


happens-before〈 发 生 于 之 前 ) 关系 是 程序 中 操作 顺序 的 基本 构件 ， 它 指定 了 哪些 
操作 看 到 其 他 操作 的 结果 。 对 于 单个 线程 ， 它 是 直观 的 ， 如 果 一 个 操作 排 在 另 一 个 操作 
之 前 ， 那 么 该 操作 就 发 生 于 另 一 个 操作 之 前 。 这 就 意味 着 ， 在 源 代码 中 ， 如 果 一 个 操作 
(A) 发 生 于 另 一 个 操作 (B) 之 前 的 语句 里 ， 那 么 A 就 发 生 于 B 之 前 。 你 可 以 在 清单 
5.2 中 看 到 ; data 的 写 人 操作 发生 于 data ready 的 读 取 操作 @ 之 前 。 如 果 操 作 发 
生 在 同一 条 语 名 中， 一 般 它们 之 间 没 有 happens-before 关系 ， 因 为 它们 是 无 序 的 。 这 只 
是 顺序 未 指定 的 另 一 种 说 法 。 你 知道 清单 5.3 中 的 代码 程序 将 输出 “1, 2” 或 “2, 1”， 
但 是 并 未 指定 究竟 是 哪个 ， 因 为 对 get_num () 的 两 次 调用 的 顺序 未 指定 。 
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清单 5.3 ”一 个 函数 调用 的 参数 的 估计 顺序 是 


#include <iostream> 


未 指定 的 


void foo(int a,int b) 


{ 


std: :cout<<a<<","<<b<<std::endl; 
int get_num() 
{ 

static int i=0; 

return ++i; 


) 


int main() 
( Ld 对 get_num0 的 调用 是 无 
foo(get num(),get num()) 序 的 


) 


有 时 候 ,单条 语句 中 的 操作 是 有 顺序 的 ， 例 如 使 用 内 置 的 逗号 操作 符 或 者 使 用 一 个 
表达 式 的 结果 作为 另 一 个 表达 式 的 参数 。 但 是 ， 一 般 来 说 ， 单 条 语句 中 的 操作 是 非 顺 序 
的 ， 而 且 也 没有 sequenced-before (因此 也 没有 happens-before) 。 当 然 ， 一 条 语句 中 的 所 
有 操作 在 下 一 句 的 所 有 操作 之 前 发 生 。 

这 确实 只 是 你 习惯 的 单线 程 顺 序 规则 的 一 个 重 述 , 那么 新 的 呢 ? 新 的 部 分 是 线程 之 
间 的 交互 ， 如 果 线 程 间 的 一 个 线程 上 的 操作 A 发 生 于 另 一 个 线程 上 的 操作 B 之 前 ， 那 
4 A 发 生 于 B 之 前 。 这 并 没有 真 的 起 到 多 大 帮助 ， 你 只 是 增加 了 一 种 新 的 关系 (线程 
间 happens-before) , 但 这 在 你 编写 多 线程 代码 时 是 一 个 重要 的 关系 。 

在 基础 水 平 上 ， 线 程 间 happens-before 相对 简单 ， 并 依赖 于 5.3.1 节 中 介绍 的 
synchronizes-with 关系 ， 如 果 一 个 线程 中 的 操作 A 与 另 一 个 线程 中 的 操作 B 同步 ， 
那么 A 线程 间 发 生 于 B 之 前 。 这 也 是 一 个 可 传递 关系 ， 如 果 A 线程 间 发 生 于 了 B 之 
Hn, B 线程 间 发 生 于 CZA, WA A 线程 间 发 生 于 C 之 前 。 你 也 可 以 在 清单 5.2 
中 看 到 。 

线程 间 happens-before 还 可 与 sequenced-before 关系 结合 ， 如 果 操 作 A W) 顺序 在 操 
作 B 之 前 ,操作 B 线程 间 发 生 于 C 之 前 ， 那 么 A 线程 间 发 生 于 C 之 前 。 类 似 地 ， 如 果 
A 与 B 同步 ，B 的 顺序 在 操作 C ZA, 那么 A 线程 间 发 生 于 C 之 前 。 这 两 个 在 一 起 意 
味 着 , 如 果 你 对 单个 线程 中 的 数据 做 了 一 系列 的 改变 , 对 于 执行 C 的 线程 上 的 后 续 线 程 
可 见 的 数据 ， 你 只 需要 一 个 synchronizes-with KA. 

这 些 是 在 线程 间 强 制 操作 顺序 的 关键 规则 ， 使 得 清单 5.2 中 的 所 有 东西 得 以 运 
行 。 数 据 依赖 性 有 一 些 额外 的 细微 差别 ， 你 很 快 就 会 看 到 。 为 了 让 你 理解 这 一 点 ， 
我 需要 介绍 用 于 原子 操作 的 内 存 ) 顺序 标签 ， 以 及 它们 如 何 与 synchronizes-with 关系 
相关 联 。 
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原子 操作 的 内 存 顺序 
有 六 种 内 存 顺 序 选 项 可 以 应 用 到 原子 类 型 上 的 操作 : memory order relaxed, 


memory order consume, memory order acquire, memory order release, 
emory order acq rel 和 memory order seq cst。 除 非 你 为 某 个 特定 的 操作 作出 指 
iE, 原子 类 型 上 的 所 有 操作 的 内 存 顺 序 选 项 都 是 memory order seq cst, XXE" 
的 可 用 选项 。 尽 管 有 六 种 顺序 选项 ， 他 们 其 实 代表 了 三 种 模型 :顺序 一 致 sequentially 
consistent ) 顺序 (memory order seq cst )、 效 得 -释放 (acquire-release ) 顺序 
(memory order consume, memory order acquire, memory order release 和 
memory order acq rel), MKHARI (relaxed) 顺序 (memory order relaxed), 

这 些 不 同 的 内 存 顺 序 模型 在 不 同 的 CPU 架构 上 可 能 有 着 不 同 的 成 本 。 例 如 ， 在 基 
于 具有 通过 处 理 器 而 非 做 更 改 者 对 操作 的 可 见 性 进行 良好 控制 架构 上 的 系统 中 ,顺序 一 
致 的 顺序 相对 于 获得 -释放 顺序 或 松散 顺序 ， 以 及 获得 -释放 顺序 相对 于 松散 顺序 ， 可 能 
会 要 求 额 外 的 同步 指令 。 如 果 这 些 系统 拥有 很 多 处 理 器 ， 这 些 额 外 的 同步 指令 可 能 占据 
显著 的 时 间 量 ， 从 而 降低 该 系统 的 整体 性 能 。 另 一 方面 ， 为 了 确保 原子 性 ， 对 于 超出 需 
要 的 获得 -释放 排序 ， 使 用 x86 或 x86-64 架构 (如 在 台式 PC 中 常见 的 Intel 和 AMD 处 
理 器 ) 的 CPU 不 会 要 求 额外 的 指令 ， 甚 至 对 于 载 人 操作 ， 顺 序 一 致 顺序 不 需要 任何 特 
殊 的 处 理 ， 尽 管 在 存储 时 会 有 一 点 额外 的 成 本 。 

不 同 的 内 存 顺序 模型 的 可 用 性 ， 允 许 高 手 们 利用 更 细 粒 度 的 顺序 关系 来 提升 性 能 ， 
在 不 太 关键 的 情况 下 ， 当 允许 使 用 默认 的 顺序 一 致 顺序 时 ， 他 们 是 有 优势 的 。 

为 了 选择 使 用 哪个 顺序 模型 ， 或 是 为 了 理解 使 用 不 同 模型 的 代码 中 的 顺序 关系 ， 了 
解 该 选择 会 如 何 影响 程序 行为 是 很 重要 的 。 因 此 让 我 们 来 看 一 看 每 种 选择 对 于 操作 顺序 
和 synchronizes-with 的 后 果 。 


默认 的 顺序 被 命名 为 顺序 一 臻 《sequentially consistent)， 因 为 这 意味 着 程序 的 行为 
与 一 个 简单 的 顺序 的 世界 观 是 一 致 的 。 如 果 所 有 原子 类 型 实例 上 的 操作 是 顺序 一 致 的 ， 
多 线程 程序 的 行为 ， 就 好 像 是 所 有 这 些 操作 由 单个 线程 以 某 种 特定 的 顺序 进行 执行 一 
样 。 这 是 迄今 为 止 最 容易 理解 的 内 存 顺 序 ， 这 也 是 它 作为 默认 值 的 原因 。 所 有 线程 都 必 
须 看 到 操作 的 相同 顺序 。 这 使 得 推断 用 原子 变量 编写 的 代码 的 行为 变 得 容易 。 你 可 以 写 
下 不 同 线程 的 所 有 可 能 的 操作 顺序 ， 消 除 那些 不 一 致 的 ， 并 验证 你 的 代码 在 其 他 程序 里 
是 否 和 预期 的 行为 一 样 。 这 也 意味 着 ， 操 作 不 能 被 重 排 。 如 果 你 的 代码 在 一 个 线程 中 有 
一 个 操作 在 另 一 个 之 前 ， 其 顺序 必须 对 所 有 其 他 的 线程 可 见 。 

从 同步 的 观点 来 看 ,顺序 一 致 的 存储 与 读 取 该 存储 值 的 同一 个 变量 的 顺序 一 致 载 人 
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是 同步 的 。 这 提供 了 一 种 两 个 (或 多 个 ) 线程 操作 的 顺序 约束 ， 但 顺序 一 致 比 它 更 加 强 
大 。 在 使 用 顺序 一 致 原子 操作 的 系统 中 ， 所 有 在 载 入 后 完成 的 顺序 一 致 原子 操作 ， 也 必 
须 出 现在 其 他 线程 的 存储 之 后 。 清 单 5.4 中 的 示例 实际 演示 了 这 个 顺序 约束 。 该 约束 并 
不 会 推进 使 用 具有 松散 内 存 顺序 的 原子 操作 ， 它 们 仍然 可 以 看 到 操作 处 于 不 同 的 顺序 ， 
所 以 你 必须 在 所 有 的 线程 上 使 用 顺序 一 致 的 操作 以 获 利 。 

然而 ， 易 于 理解 就 产生 了 代价 。 在 一 个 带 有 许多 处 理 器 的 弱 顺 序 机 器 上 ， 它 可 能 导 
致 显著 的 性 能 惩罚 ， 因 为 操作 的 整体 顺序 必须 与 处 理 器 之 间 保持 一 致 ， 可 能 需要 处 理 器 
之 间 进 行 密集 ( 且 昂 贵 ) 的 同步 操作 。 这 就 是 说 , 有 些 处 理 器 架构 (如 常见 的 x86 和 x86-64 
架构 ) 提供 相对 低廉 的 顺序 一 致 性 ， 因 此 如 果 你 担心 使 用 顺序 一 致 顺序 对 性 能 的 影响 ， 
检查 你 的 目标 处 理 器 架构 的 文档 。 
” ”清单 54 实际 展示 了 顺序 一 致 性 。x 和 y 的 载 人 和 存储 是 用 memory order seq cst 
显 式 标记 的 ， 尽 管 此 标记 在 这 种 情况 下 可 以 省 略 ， 因 为 它 是 默认 的 。 


清单 5.4， 顺 序 一 致 隐 含 着 总 体 顺序 


#include «atomic» 
#include «thread» 
#include <assert.h> 


std::atomic<bool> x,y; 
std::atomic<int> 2; 


void write_x() 


{ 


x. store (true, std: :memory_order_seq_cst) ; +@ 


} 


void write y() 


{ 


y. store (true, std: :memory_order_seq_cst) ; +@ 


} 


void read_x_then_y() 


{ 


while(!x.load(std::memory order seq cst)); 
if(y.load(std::memory order seq cst)) «-9 
+423 


} 


void read_y_then_x() 


{ 


while(!y.load(std::memory order seq cst)); 
if(x.load(std::memory order seq cst)) 0 
++Z; 
) 


int main() 


{ 


x=false; 
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ysfalse; 

z=0; 

std::thread a(write x); 
Std::thread b(write y); 
std::thread c(read x then y); 
std::thread d(read y then x); 
a.join(); 


.load() 1=0)) +@ 


assert@ 可 能 永远 不 触发 ， 因 为 对 x 的 存储 @ 或 者 对 y 的 存储 四 必须 先 发 生 ， 尽 
管 没有 特别 指定 。 如 果 read x then y PRA yR false, x 的 存储 必须 发 生 于 
y 的 存储 之 前 ， 这 时 read y then x 中 载 人 x@ 必 须 返 回 true, HH while 循环 在 
这 一 点 上 确保 y 是 true, HF memory order seq cst 的 语义 需要 在 所 有 标记 
memory order seq cst 的 操作 上 有 着 单个 总 体 顺 序 , 返回 false 的 载 人 yY@ 和 对 x 
的 存储 四 之 间 有 一 个 隐 含 的 顺序 关系 。 为 了 有 单一 的 总 体 顺序 ， 如 果 一 个 线程 看 到 
x==true， 随 后 看 到 yY==false， 这 意味 着 在 这 个 总 体 顺序 上 , x 的 存储 发 生 在 y 的 存 
储 之 前 。 

当然 ， 因 为 一 切 是 对 称 的 ， 它 也 可 能 反方 向 发 生 ，x 的 载 人 @ 返 回 false, E y 
的 载 人 @ 返 回 true。 在 这 两 种 情况 下 ，z 都 等 于 1。 两 个 载 人 都 可 能 返回 true， 导 致 
z 等 于 2, 但 是 无 论 如 何 z 都 不 可 能 等 于 0。 

对 于 read x then y 看 到 x 为 true 且 Y 为 false 的 情况 ,其 操作 和 happens-before 
关系 如 图 5.3 所 示 。 从 read x then y 中 y 的 载 人 到 write_y 中 y 的 存储 的 虚线 ,展示 
了 所 需要 的 隐 含 的 顺序 关系 以 保持 顺序 一 致 。 在 memory_order_seq_cst 操作 的 全 局 顺 
序 中 ， 载 人 必须 发 生 在 存储 之 前 ， 以 达到 这 里 所 给 的 结果 。 


=a 
E 
x.load() y.load() 
| 返回 true 返回 true 
|| y.load() | x.load() 
| 返回 false 返回 true 


write x read x then y read y then x write y 


图 5.3 顺序 一 致 和 happens-before 
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顺序 一 致 是 最 直观 和 直觉 的 排序 ， 但 也 是 最 昂贵 的 内 存 顺序 ， 因 为 它 要 求 所 有 线程 
之 间 的 全 局 同步 。 在 多 处 理 器 系统 中 ， 这 可 能 需要 处 理 器 之 间 相 当 密集 和 耗 时 的 通信 。 
为 了 避免 这 种 同步 成 本 , 你 需要 跨 出 顺序 一 致 的 世界 , 并 考虑 使 用 其 他 的 内 存 顺 序 。 


2， 非 顺序 一 致 的 内 存 顺 序 


一 旦 你 走出 美好 的 顺序 一 致 的 世界 ， 事情 开 始 变 得 复杂 起 来 。 可 能 要 面 对 的 一 个 最 
大 问题 是 事件 不 再 有 单一 的 全 局 顺序 的 事实 。 这 意味 着 ， 不 同 的 线程 可 能 看 到 相同 的 操 
作 的 不 同方 面 ,以 及 你 所 拥有 的 不 同 线程 操作 一 前 一 后 整齐 交错 的 所 有 心理 模型 都 必须 
扔 到 一 边 。 你 不 仅 得 考虑 事情 真正 的 并 行 发 生 ， 而 且 线程 不 必 和 事 件 的 顺序 一 致 。 为 了 
编写 (或 者 甚至 只 是 理解 ) 任何 使 用 非 默 认 的 memory order seq cst 内 存 顺序 的 代 
码 ， 让 你 的 大 脑 思考 这 个 问题 绝对 是 至 关 重 要 的 。 这 不 仅仅 意味 着 编译 器 能 够 重新 排列 
指令 , 即使 线程 正在 运行 完全 相同 的 代码 , 由 于 其 他 线程 中 的 操作 没有 明确 的 顺序 约束 ， 
它们 可 能 与 事件 的 顺序 不 一 致 ， 因 为 不 同 的 CPU 缓存 和 内 部 缓冲 区 可 能 为 相同 的 内 存 
保存 了 不 同 的 值 。 它 是 如 此 重要 以 至 于 我 要 再 说 一 遍 : 线程 不 必 和 事 件 的 顺序 一 致 。 

你 不 仅 要 将 基于 交错 操作 的 心理 模型 扔 到 一 边 , 还 得 将 基于 编译 器 或 处 理 器 重 排 指 
令 的 思想 的 心理 模型 也 扔 掉 。 在 没有 其 他 的 顺序 约束 时 ， 唯 一 的 要 求 是 所 有 的 线程 对 每 
个 独立 变量 的 修改 顺序 达成 一 致 。 不 同 变量 上 的 操作 可 以 以 不 同 的 顺序 出 现在 不 同 的 线 
程 中 ， 前 提 是 所 能 看 到 的 值 与 所 有 附加 的 顺序 约束 是 一 致 的 。 

通过 完全 跳出 顺序 一 致 的 世界 ， 并 未 所 有 操作 使 用 memory order_relaxed, 就 
是 最 好 的 展示 。 一 旦 你 掌握 了 ， 就 可 以 回 过 头 来 看 获得 -释放 顺序 ， 它 让 你 选择 性 地 在 
操作 之 间 引 入 顺序 关系 ， 夺 回 一 些 理性 。 


3. 松散 顺序 


以 松散 顺序 执行 的 原子 类 型 上 的 操作 不 参与 synchronizes-with 关系 。 单 线程 中 的 同 
一 个 变量 的 操作 仍然 服从 happens-before 关系 ， 但 相对 于 其 他 线程 的 顺序 几乎 没有 任何 
要 求 。 唯 一 的 要 求 是 ， 从 同一 个 线程 对 单个 原子 变量 的 访问 不 能 被 重 排 ， 一 旦 给 定 的 线 
程 已 经 看 到 了 原子 变量 的 特定 值 ， 该 线程 之 后 的 读 取 就 不 能 获取 该 变量 更 早 的 值 。 在 没 
有 任何 额外 的 同步 的 情况 下 ， 每 个 变量 的 修改 顺序 是 使 用 memory order relaxed 
的 线程 之 间 唯 一 共享 的 东西 。 

为 了 展示 松散 顺序 操作 到 底 能 多 松散 ， 你 只 需要 两 个 线程 ， 如 清单 5.5 所 示 。 


清单 5.5 ”放松 操作 有 极 少 数 的 排序 要 求 


#include «atomic» 
#include «thread» 
#include «assert.h» 
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std::atomic<bool> x,y; 
std::atomic<int> z; 


void write x then y() 


x.Store(true,std::memory order relaxed); 


y.store(true,std::memory order relaxed); 


) 


void read y. then x() 


while(!y.load(std::memory order relaxed)); 
if (x.load(std::memory order relaxed)) 


T-Z; 


int main() 


x=false; 
y=false; 
z=0; 
std::thread a(write x then y); 
std::thread b(read y then x); 
a.join(); 

DJON 0s 

assert (z.load() !=0); 


«9 


-0 
+O 


«e 


E 


这 次 assert@ 可 以 触发 , 因为 x HRA @ 能 够 读 到 false, 即便 是 y HRA 6 
读 到 了 true 并 且 x 的 存储 @ 发 生 于 y 存储 @ ZH. x 和 y 是 不 同 的 变量 , 所 以 关于 


每 个 操作 所 产生 的 值 的 可 见 性 没有 顺 
序 保证 。 

不 同 变 量 的 松散 操作 可 以 被 自由 
地 重 排 ， 前提 是 它们 服从 所 有 约束 下 
的 happens-before 关系 (例如 ， 在 同一 
eee fe) | SL 
synchronizes-with 关系 。 清 单 5.5 中 的 
happens-before 关系 如 图 5.4 所 示 ， 伴 
随 一 个 可 能 的 结果 。 即 便 在 存储 操作 
之 间 和 载 人 操作 之 间 存 在 happens- 
before 关系 , 但 任 一 存储 和 任 一 载 人 之 
间 却 不 存在 ， 所 以 载 人 可 以 在 顺序 之 
外 看 到 存储 。 

让 我 们 在 清单 5.6 中 看 一 看 带 有 


三 个 变量 和 五 个 线程 的 稍微 复杂 的 例子 。 


起 始 x=false, y=false 
x.store (true, 
relaxed) 
y.store(true, 
| relaxed) 


y.load (relaxed) 
返回 true 
x.load(relaxed) 
返回 false 


read y then x 


图 5.4 松散 的 原子 和 happens-before 


write x then y 
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清单 5.6 多 线程 的 松散 操作 


#include <thread> 
#include <atomic> 
#include <iostream> 


std::atomic<int> x(0),y(0),z(0); 0 
std::atomic<bool> go (false); ^e 


unsigned const loop count-10; 


struct read values 


{ 
F 


read values valuesl[loop count]; 
read values values2 [loop count]; 
read values values3 [loop count]; 
read values values4 [loop count]; 
read values values5[loop count]; 


int x Vr 


void increment (std: :atomic<int>* var to inc,read values* values) 
{ 
while (!go) < 一 
std::this_thread::yield(); ò 旋转 ， 等 待 信号 
for (unsigned i-0;i«loop count;-*i) 
{ 
values [i] .x=x.load (std: :memory_order_relaxed) ; 
values [i] .y=y.load (std: :memory_order_relaxed) ; 
values[i].z-z.load(std::memory order relaxed); 
var to inc-»store(i«1,std::memory order relaxed); 0 
std::this thread::yield(); 


) 


void read vals(read values* values) 
{ 9 旋转 ， 等 待 信号 
while(!go) < 二 
std::this thread::yield(); 
for (unsigned i=0;i<loop_count;++i) 
{ 
values[i] .x=x.load(std: :memory_order_relaxed) ; 
values [i] .y=y.load (std: :memory_order_relaxed) ; 
values[i].z-z.load(std::memory order relaxed); 
std::this thread::yield(); 


) 


void print(read values* v) 


{ 


for (unsigned i=0;i<loop_count; ++i) 


{ 


Sit) 
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gtd: outes", "y 
Std: :coutb««!( "xv bil xes Ra bl a hijian] 


} 
Std::cout««std::endl; 
} 
int main() 
{ 


std::thread tl(increment,&x,values1); 

std::thread t2 (increment, &y,values2) ; 

std: :thread t3 (increment, &z,values3) ; 

std::thread t4(read vals,values4); 
TEN 


std::thread read vals,values5); 
go-true; 
eee fo 

JOU) 
t4.join(); 信号 
t3.join(); 
t2.join(); 
t1.join(); 

UMOR 

print (values1); 


( 

print (values2); 
print (values3); 
print (values4); a 
print (values5); 


本 质 上 这 是 一 个 非常 简单 的 程序 。 你 有 三 个 共享 的 全 局 原子 变量 @ 和 五 个 线程 。 
每 个 线程 循环 10 次, 用 memory order relaxed 读 取 三 个 原子 变量 的 值 , 并 将 其 
存储 在 数组 中 。 这 三 个 线程 中 的 每 个 线程 每 次 通过 循环 @ 更 新 其 中 一 个 原子 变量 ， 
而 其 他 两 个 线程 只 是 读 取 。 一 旦 所 有 的 线程 都 被 连接 ， 你 就 打印 由 每 个 线程 存储 在 
数组 中 的 值 @。 

原子 变量 go@ 用 来 确保 所 有 的 线程 尽 可 能 靠近 相同 的 时 间 开始 循环 。 启 动 一 个 线 
程 是 一 个 昂贵 的 操作 ， 若 没有 明确 的 延迟 ， 第 一 个 线程 可 能 会 在 最 后 一 个 线程 开始 前 就 
结束 了 。 每 个 线程 在 进入 主 循环 之 前 等 待 go 变 成 true@、@,， 仅 当 所 有 的 线程 都 已 经 
开始 后 8 go 才 被 设置 成 +rue。 

这 个 程序 的 一 个 可 能 的 输出 如 下 所 示 。 


(0,0,0),(1,0,0), (2,0,0), (3,0,0), (4,0,0), (5,7,0), (6,7,8) , (7,9,8) , (8,9,8) , 


(9,9, 10) 
(0/50509880,5,0) (07 2,0) 7 (1, 355) (ey, SB Sn) (ane ey (8, 780 uO meno Ny 
(0r 95 10) 
(9/505:0)0520005072)7(0,0,2) , (070,3); (0,0,4)74075,0, 5) 0050/8) (OO Om 
(0,0, 9) 


(br oma 1) ; (8,6,4) , (3/9,5) , (5,10,6).,,(5,10, 8), (5 10» Lone, 
(9,10,10), (10,10,10) 

(0, 0,01 79001 OO OO AO (GT 35/7) 50675, 7) , (7,05 2) - (7,8, 7:087 BO Tene ee) 
(Br 89) 
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前 三 行 是 线程 在 进行 更 新 , 最 后 两 行 是 线程 仅 进 行 读 取 。 每 个 三 元 组 是 一 组 变量 x, 
y 和 z 以 这 样 的 顺序 经 历 循环 。 这 个 输出 中 有 几 点 要 注意 。 
m 第 一 系列 值 显示 了 x 在 每 个 三 元 组 里 依次 增加 1， 第 二 系列 y 依次 增加 1， 以 
及 第 三 系列 z 依次 增加 1。 
WB ”每 个 三 元 组 的 X 元 素 仅 在 给 定 系 列 中 自 增 ，y 和 z 元 素 也 一 样 ， 但 增 量 不 是 平 
均 的 ， 而 且 在 所 有 线程 之 间 的 相对 顺序 也 不 同 。 
Wo ”线程 3 并 没有 看 到 任何 的 x 或 y 的 更 新 ， 它 只 能 看 到 它 对 z 的 更 新 。 然 而 这 并 
不 能 阻止 其 他 线程 看 到 对 z 的 更 新 混合 在 对 xX 和 yy 的 更 新 中 。 
这 对 于 松散 操作 是 一 个 有 效 的 结果 , 但 并 非 唯一 有 效 的 结果 。 任何 由 三 个 变量 组 成 ， 
每 个 变量 轮流 保存 从 0 到 10 的 值 , 同时 使 得 线程 递增 给 定 的 变量 , 并 打印 出 该 变量 从 0 
到 9 的 值 的 一 系列 值 ， 都 是 有 效 的 。 


4. 理解 松散 顺序 


为 了 理解 这 是 如 何 工作 的 ， 想 象 每 个 变量 是 一 个 在 小 隔 间 里 使 用 记事 本 的 人 。 在 他 
的 记事 本 上 有 一 列 值 。 你 可 以 打 电 话 给 他 ， 要 求 他 给 你 一 个 值 ， 或 者 你 可 以 告诉 他 写 下 
了 二 个 新 值 。 如 果 你 告诉 他 写 下 新 值 ， 他 就 将 其 写 在 列表 底部 。 如 果 你 向 他 要 一 个 值 ， 
他 就 为 你 从 列表 中 读 取 一 个 数字 。 

第 一 次 你 跟 这 个 人 交谈 ， 如 果 你 向 他 要 一 个 值 ， 此 时 他 可 能 从 他 记事 本 上 的 列表 
里 任意 给 你 一 个 值 。 如 果 你 接着 向 他 要 另 一 个 值 ， 他 可 能 会 再 次 给 你 同一 个 值 ， 或 是 
从 列表 下 方 给 你 一 个 。 他 永远 不 会 给 你 一 个 在 列表 中 更 上 面 的 值 。 如 果 你 告诉 他 写 下 
一 个 数字 ， 然 后 再 要 一 个 值 ， 他 要 么 给 你 刚才 你 让 他 写 下 的 数字 ， 或 者 是 列表 上 在 那 
以 下 的 数字 。 

假设 某 一 次 他 的 列表 以 这 些 值 开 始 5、10、23、3、1、2。 如 果 你 要 一 个 值 ， 你 会 得 
到 其 中 的 任意 一 个 。 如 果 他 给 你 10， 下 一 次 他 可 能 再 给 你 一 个 10， 或 者 后 面 的 其 他 值 ， 
但 不 会 是 5。 如 果 你 呼叫 他 5 次 ， 举 个 例子 ， 他 可 能 会 说 “10、10、1、2、2  。 如 果 你 
告诉 他 写 下 42, 他 会 将 其 添加 在 列表 末尾 。 如 果 你 再 向 他 要 数字 , 他 将 一 直 告 诉 你 42 ， 
直到 他 的 列表 上 有 另 一 个 数 ， 并 且 他 愿意 告诉 你 时 。 

现在 ， 假 设 你 的 朋友 Carl 也 有 这 个 人 的 号 码 。Carl 也 可 以 打 电 话 给 他 ， 要 人 么 
请 他 写 下 一 个 数字 或 是 索取 一 个 数字 ， 他 跟 对 待 你 一 样 ， 对 Carl 应 用 相同 的 规则 。 
他 只 有 一 部 电话 ， 因 此 他 一 次 只 能 处 理 你 们 中 的 一 个 人 ,所 以 他 记事 本 上 的 列表 是 
一 个 非常 直观 的 列表 。 但 是 , 仅仅 因为 你 让 他 写 下 了 新 的 号 码 ， 并 不 意味 着 他 必须 
将 其 告诉 Carl, 反之 亦 然 。 如 果 Carl 向 他 索取 一 个 数字 ， 并 被 告知 “23”， 然 后 仅 
仅 因为 你 要 求 这 个 人 写 下 42 并 不 意味 着 他 下 一 次 就 会 告诉 Carl。 他 可 能 会 将 23、 
3、1、2、42 这 些 数 字 中 的 任何 一 个 告诉 Carl， 或 者 甚至 是 在 你 呼叫 他 之 后 ，Fred 
告诉 他 写 下 来 的 67。 他 很 可 能 会 告诉 Carl“23、3、3、1、67”， 这 与 他 告诉 你 的 
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也 没什么 矛盾 。 就 像 是 他 为 每 个 人 设 了 一 个 小 小 的 移动 便签 ， 把 他 对 谁 说 了 什么 数 


都 进行 了 记录 ， 如 图 5.5 所 示 。 d 
现在 假设 不 仅仅 是 一 个 人 在 一 个 小 隔 间 ， 2s CT] C] 
而 是 整个 隔 间 群 , 有 一 大 帮 带 着 电话 和 笔记 本 s 


的 人 。 这 些 都 是 我 们 的 原子 变量 。 每 一 个 变量 。 zm、 

都 有 自己 的 修改 顺序 (笔记 本 上 的 列表 的 值 )， 

但 是 它们 之 间 完 全 没有 关系 。 如 果 任意 一 个 呼 e 

叫 者 (ff. Carl, Anne, Dave 和 Fred) 是 一 图 5.5 小 隔 间 里 的 人 的 笔记 本 


个 线程 ， 那 么 这 就 是 每 个 操作 都 使 用 memory order relaxed 时 你 所 得 到 的 东西 。 
还 有 一 些 你 可 以 告诉 隔 间 里 的 人 的 额外 的 事情 ， 比 如 “ 记 下 这 个 号 码 ， 并 告诉 我 
列表 的 底部 是 什么 ”(exchange) 和 “ 写 下 这 个 数字 ， 如 果 列 表 底 部 的 数字 正 是 它 ， 
否则 告诉 我 应 该 猜 到 什么 ”(compare_exchange _strong)， 但 是 这 并 不 影响 一 般 的 
原则 。 

如 果 你 仔细 地 想 一 想 清 单 5.5 中 的 程序 逻辑 , write x then y 就 像 是 某 个 家 伙 打 
电话 告诉 小 隔 间 x 中 的 人 让 他 写 下 true， 然 后 再 打 电 话 给 小 隔 间 y 中 的 人 让 他 写 下 
true, i31; read y then x 的 线程 不 断 地 呼叫 小 隔 间 y 中 的 人 询问 一 个 值 ， 一 直到 
他 说 true， 然 后 再 向 小 隔 间 x 中 的 人 询问 值 。 这 个 在 小 隔 间 x 中 的 人 没有 义务 告诉 你 
他 列表 上 的 任何 一 个 具体 的 值 ， 并 且 还 有 权利 说 £alse, 

这 就 使 得 松散 的 原子 操作 难以 处 理 。 他 们 必须 与 具有 更 强 的 顺序 语义 的 原子 操作 结 
合 起 来 使 用 ， 以 便 在 线程 间 同 步 中 发 挥 作 用 。 我 强烈 建议 避免 松散 的 原子 操作 ， 除 非 绝 
对 必要 ， 即 便 这 样 ， 也 应 该 极其 谨慎 地 使 用 之 。 在 清单 5.5 中 ， 仅 仅 是 两 个 线程 和 两 个 
变量 就 能 让 所 得 到 的 结果 这 样 不 直观 , 鉴于 此 , 不 难 想象 在 涉及 更 多 线程 和 变量 的 时 候 ， 
会 变 得 多 么 复杂 。 

一 种 避免 全 面 顺序 一 致 性 开销 的 达到 额外 同步 的 方法 ， 是 使 用 获取 -释放 顺序 。 


5. 获取- 释放 顺序 


获取 -释放 顺序 是 松散 顺序 的 进步 ， 操 作 仍 然 没 有 总 的 顺序 ， 但 的 确 引 入 了 一 些 同 
步 。 在 这 种 顺序 模型 下 ,原子 载 人 是 获取 (aquire) 操作 (memory order acquire), 
原子 存储 是 释放 (release) 操作 (memory order release), 原子 的 读 - 修 改 - 写 操作 
(例如 fetch add() 或 exchange() ) 是 获取 、 释 放 或 两 者 兼备 (memory 
order acq rel), 同步 在 进行 释放 的 线程 和 进行 获取 的 线程 之 间 是 对 偶 的 。 释放 操 作 
与 读 取 写 入 值 的 获取 操作 同步 。 这 意味 着 ， 不 同 的 线程 仍然 可 以 看 到 不 同 的 排序 ， 但 这 
些 顺 序 是 受到 限制 的 。 清 单 5.7 采用 获取 -释放 语义 而 不 是 顺序 一 致 顺序 ， 对 清单 5.4 3t 
fr TW, 
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清单 5.7 ”获取 -释放 并 不 意味 着 总 体 排序 


#include <atomic> 
#include «thread» 
#include <assert.h> 


std::atomic<bool> x,y; 
std::atomic<int> z; 


void write x() 


{ 
} 


void write_y() 


{, 
} 


void read_x_then_y() 


{ 


x. store (true, std: :memory_order_release) ; 


y.store (true, std: :memory_order_release) ; 


while(!x.load(std::memory order acquire)); 
if(y.load(std::memory order acquire)) 0 
++Z; 


} 


void read y then x() 


{ 


while(!y.load(std::memory order acquire)); 


if(x.load(std::memory order acquire)) «e 
TZ; 
) 
int main() 
{ 
x=false; 
y=false; 
220 


std::thread a(write x); 
std::thread b(write y); 
std::thread c(read x then y); 
std::thread d(read y then x); 
a.join(); 

b.join(): 

c.,join(); 

d.jein():; 

assert (z.load() !=0); «e 


在 这 个 例子 里 , 断言 @ 可 以 触发 (就 像 在 松散 顺序 中 的 例子 ), 因为 对 x WRA @ 
和 对 y 的 载 人 @ 都 读 取 false 是 可 能 的 。x My 由 不 同 的 线程 写 人 ， 所 以 每 种 情况 下 
从 释放 到 获取 的 顺序 对 于 另 一 个 线程 中 的 操作 是 没有 影响 的 。 

图 5.6 展示 了 清单 5.7 中 的 happens-before 关系 , 伴随 一 种 可 能 的 结果 ， 即 两 个 读 线 
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程 看 到 了 世界 的 不 同方 面 。 这 可 能 是 因为 没有 像 前 面 提 到 的 happens-before 关系 来 强制 


顺序 o 


起 始 x=false, y=false 


x.store(true, | 
| release) 


y.load (acquire) || x.load (acquire) 
返回 false | 返回 false 


write x read x then y read y then x write y 


图 5.6 ”获取 -释放 和 happens-before 


y.store (true, 
release) 


| x. load (acquire) y.load (acquire) 
返回 true 返回 true 


为 看 到 获取 -释放 顺序 的 优点 , 你 需要 考虑 类 似 清单 5.5 中 来 自 同一 个 线程 中 的 两 个 
存储 。 如果 你 将 对 y 的 存储 更 改 为 使 用 memory_order_release, 并 且 让 对 y KRA 
使 用 类 似 于 清单 5.8 HY memory order acquire, 那么 你 实际 上 就 对 x 上 的 操作 施 


加 了 一 个 顺序 。 


清单 5.8 获取 -释放 操作 可 以 在 松散 操作 中 施加 顺序 


#include «atomic» 
#include «thread» 
#include <assert.h> 


std::atomic<bool> x,y; 
std: :atomic<int> z; 


void write x then y() 


{ 


x. store (true, std: :memory_order_relaxed) ; 
y.Store(true,std::memory order release); 


) 


void read y then x() 


( 


while(!y.load(std::memory order acquire)); 


if(x.load(std::memory order relaxed)) 
TZ; 


-© 
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int main() 
{ 
x=false; 
y=false; 
z=0; 
std::thread a(write x then y); 
std::thread b(read y then x); 
a.join(); 
b.join(); 
assert (z.load()!20); 0 
} 


最 终 ， 对 y 的 加 载 目 将 会 看 到 由 存储 写 下 的 true@ 。 因 为 存储 使 用 memory. 
order release JT HK A E] memory order acquire, 存储 与 载 人 同步 。 对 x 的 
存储 @ 发 生 在 对 y 的 存储 @ 之 前 ， 因 为 它们 在 同一 个 线程 里 。 因 为 对 y 的 存储 与 从 y 的 
载 人 同步 , 对 x 的 存储 同样 发 生 于 从 y 的 载 人 之 前 , 并 且 推 而 广 之 发 生 于 从 x HRA O 
之 前 。 FR, Mx 的 载 人 必然 读 到 true， 而 且 断 言 @ 不 会 触发 。 如 果 从 y 的 载 人 不 在 
while 循环 里 ， 就 不 一 定 是 这 个 情况 ， 从 y 的 载 人 可 能 读 到 false， 在 这 种 情况 下 ， 
对 从 x 读 取 到 的 值 就 没有 要 求 了 。 为 了 提供 同步 ， 获 取 和 释放 操作 必须 配对 。 由 释放 操 
作 存 储 的 值 必须 被 获取 操作 看 到 ， 以 便 两 者 中 的 任意 一 个 生效 。 如 果 @ 处 的 存储 或 自 处 
的 载 人 有 一 个 是 松散 操作 ， 对 x 的 访问 就 没有 顺序 ， 因 此 就 不 能 确保 @ 处 的 载 入 读 取 
true, H assert 会 被 触发 。 

你 仍然 可 以 用 带 着 笔记 本 在 他 们 小 隔 间 的 人 们 的 形式 来 考虑 获取 -释放 顺序 ， 
但 是 你 必须 对 模型 添加 更 多 。 首 先 ， 假 定 每 个 已 完成 的 存储 都 是 一 批 更 新 的 一 部 
分 ， 因 此 当 你 呼叫 一 个 人 让 他 写 下 一 个 数字 时 ， 你 也 要 告诉 他 这 次 更 新 是 哪 一 批 
的 一 部 分 :“ 请 写 下 99， 作 为 第 423 批 的 一 部 分 ”"。 对 于 一 批 的 最 后 一 次 存储 ， 你 
也 可 以 这 样 告诉 他 :“ 请 写 下 147， 作 为 第 423 批 的 最 后 一 次 的 存储 "。 小 隔 间 中 的 
人 会 及 时 地 写 下 这 一 信息 ， 以 及 谁 给 了 他 这 些 值 。 这 模拟 了 一 个 存储 -释放 操作 。 
下 一 次 ， 你 告诉 某 人 写 下 一 个 值 ， 你 应 增加 批 次 号 码 :“ 请 写 下 41， 作 为 第 424 
HH — BB at” 

当 你 询问 一 个 值 时 ,会 有 一 个 选择 :你 可 以 仅仅 询问 一 个 值 ( 这 是 个 松散 载 人 )， 
在 此 情况 下 这 个 人 只 会 给 你 一 个 数字 , 或 者 你 可 以 询问 一 个 值 以 及 它 是 不 是 这 一 批 
中 最 后 一 个 数 的 信息 (模拟 载 人 -获取 )。 如 果 你 询问 批 次 信息 ， 并 且 该 值 不 是 这 一 
批 中 的 最 后 一 个 , 他 会 告诉 你 类 似 于 “这 个 数字 是 987, 仅仅 是 一 个 “普通 的 值 ， 
然而 如 果 它 曾经 是 这 一 批 中 的 最 后 一 个 ， 他 会 告诉 你 类 似 于 “这 个 数字 是 987， 是 
来 自 Anne 的 第 956 批 的 最 后 一 个 数 "。 现 在 ， 获 取 - 释 放 语 义 闪 耀 登 场 : 如 果 当 你 
询问 一 个 值 时 告诉 他 你 所 知道 的 所 有 批 次 , 他 会 从 他 的 列表 中 向 下 查找 , 找到 你 所 
知道 的 任意 一 个 批 次 的 最 后 一 个 值 , 并 且 要 么 给 你 那个 数字 , 要 么 列表 更 下 方 的 一 
TEC. 
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这 是 如 何 模拟 获取 -释放 语义 的 呢 ? 让 我 们 看 一 看 这 个 例子 。 最 开始 ， 线 程 a 运行 
write_x_then_y 并 对 小 隔 间 x 内 的 人 说 ,“ 请 写 下 true 作为 线程 a 第 一 批 的 一 部 分 ”， 
然后 他 及 时 地 写 下 了 。 线 程 a 随后 对 小 隔 间 y 内 的 人 说 ,“ 请 写 下 true 作为 线程 a 第 
一 批 的 最 后 一 笔 "， 他 也 及 时 地 写 下 了 。 与 此 同时 ， 线 程 b 运行 着 read y then x, 
线程 b 持续 地 向 小 隔 间 y 里 的 人 索取 带 着 批 次 信息 的 值 ， 直 到 他 说 “true”。 他 可 能 要 
询问 很 多 次 ,但 是 最 终 这 个 人 总 会 说 “true”。 但 是 在 小 隔 间 y 里 的 人 不 能 仅仅 说 
"true", 他 还 要 说 “这 是 线程 a 第 一 批 的 最 后 一 笔 ”。 

现在 , 线程 b 继续 向 盒子 x 里 的 人 询问 值 , 但 是 这 一 次 他 说 :“ 请 让 我 拥有 一 个 值 ， 
并 且 通 过 这 一 方式 让 我 知晓 线程 a 的 第 一 批 ”。 所 以 现在 ， 小 隔 间 x 中 的 人 必须 查看 他 
的 列表 ， 找 到 线程 a 中 第 一 批 的 最 后 一 次 提 及 。 他 所 具有 的 唯一 一 次 提 及 是 true fü, 
同时 也 是 列表 上 的 最 后 一 个 值 ， 所 以 他 必须 读 取 该 值 ， 否 则 ， 他 会 破坏 游戏 规则 。 

如 果 你 回 到 5.3.2 节 查 看 线程 间 happens-before 的 定义 ， 一 个 重要 的 内 容 就 是 它 的 
传递 性 : MRA 线程 间 发 生 于 B 之 前 ， 并 且 B 线程 间 发 生 于 C 之 前 ， 则 A 线程 间 发 生 
T C 之 前 。 这 意味 着 获取 -释放 顺序 可 以 用 来 在 多 个 线程 之 间 同 步 数据 ， 甚 至 在 “中 间 
线程 ”并 没有 实际 接触 数据 的 场合 。 


6. 获取 -释放 顺序 传递 性 同步 


为 了 考虑 传递 性 顺序 ， 你 需要 至 少 三 个 线程 。 第 一 个 线程 修改 一 些 共享 变量 ， 并 对 
其 中 一 个 进行 存储 -释放 。 第 二 个 线程 接着 对 应 于 存储 -释放 ， 使 用 载 人 -获取 来 读 取 该 变 
量 ， 并 且 在 第 二 个 共享 变量 执行 存储 -释放 。 最 后 ， 第 三 个 线程 在 第 二 个 共享 变量 上 进 
行 载 入 -获取 。 在 载 人 -获取 操作 看 到 存储 -释放 操作 所 写 入 的 值 以 确保 synchronizes-with 
关系 的 前 提 下 , 第 三 个 线程 可 以 读 取 由 第 一 个 线程 存储 的 其 他 变量 的 值 ， 即 使 中 间 线 程 
没有 动 其 中 的 任何 一 个 。 该 情景 展示 于 清单 5.9 中 。 


清单 5.9 使 用 获取 和 释放 顺序 的 传递 性 同步 


std::atomic<int> data[5]; 
Std::atomic«bool» syncl(false),sync2(false); 


void thread 1() 

{ 
data[0].store(42,std::memory order relaxed); 
data[1].store(97,std::memory order relaxed); 
data[2].store(17,std::memory order relaxed); 
data[3].store(-141,std::memory order relaxed); 
data[4].store(2003,std::memory order relaxed); ow 
Syncl.store(true,std::memory order release); 


) 


void thread 2() 


{ 
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while(!syncl.load(std::memory order acquire)); <@ 循环 直到 syncl 被 设置 
sync2.store(true,std::memory order release); 
6 设置 sync2 


void thread 3 () 

{ 
while(!sync2.1oad(std::memory order acquire)) 
assert (data[0] .load(std::memory order relaxed)--42 


循环 直到 sync2 


Py )3 
assert (data[1].load(std::memory order relaxed)--97); 被 设置 
( X 
assert(data[3].load(std::memory order relaxed ==-141); 
( 


) 

) 
assert (data[2].load(std::memory order relaxed)--17); 

) 

) 


assert (data[4].load(std::memory order relaxed) ==2003) ; 


即使 thread 2 只 动 了 变量 sync1@ 和 sync26, 也 足以 同步 thread 1 和 
thread 3 以 确保 assert 不 会 触发 。 首 先 , M thread 1 存储 data 发 生 于 对 syncl 
的 存储 @ 之 前 ， 因 为 他 们 在 同一 个 线程 里 是 sequenced-before 关系 。 因 为 sync1@ 的 载 
入 在 while 循环 中 , 它 最 终 会 看 到 thread 1 中 存储 的 值 ， 并 且 因此 形成 释放 -获取 对 
的 另 一 半 。 因 此 ， 对 syncl 的 存储 发 生 于 syncl 在 while 循环 中 的 最 后 的 载 人 之 前 。 
该 载 入 的 顺序 在 sync2@ 之 前 (因而 也 是 happens-before 的 ), 5j thread 3 中 while 
循环 @ 构 成 了 一 对 释放 -获取 。 对 sync2 的 存储 @ 也 就 因而 发 生 在 载 人 @ 之 前 ， 又 发 生 
在 从 data RAZA. 因为 happens-before 的 传递 性 质 ， 你 可 以 将 它们 串 起 来 : 对 data 
的 存储 发 生 在 对 sync] 的 存储 @ 之 前 ， 又 发 生 在 从 syncl 的 载 人 @ 之 前 ， 又 发 生 在 对 
sync2 的 存储 @ 之 前 ， 又 发 生 在 从 sync2 的 载 人 @ 之 前 ， 又 发 生 在 data 的 载 人 之 前 。 
因此 thread 1 中 对 data 的 存储 发 生 在 thread 3 中 从 data 载 入 之 前 ， 并 且 
asserts 不 会 触发 。 

在 这 个 例子 中 , 你 通过 使 用 在 thread 2 中 的 一 个 具有 memory_order acq rel 
的 读 - 修 改 - 写 操 作 ,， 将 syncl 和 sync2 合并 为 一 个 变量 。 有 一 个 选项 是 使 用 
compare exchange strong () ， 以 确保 该 值 只 有 当 thread 1 中 的 存储 可 见 时 才能 
被 更 新 。 


std: :atomic<int> sync(0); 
void thread_1() 
{ 
E dene 
sync.store(1,std::memory order release); 


) 
void thread 2() 
{ 
int expected=1; 
while(!sync.compare_exchange_strong (expected, 2, 
std::memory order acq rel)) 
expected-1; 
) 
void thread 3() 


{ 
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while(sync.load(std::memory order acquire)<2); 


Deer 
) 


如 果 你 使 用 的 读 -修改 - 写 操作 ， 挑 选 你 所 希望 的 语义 是 很 重要 的 。 在 这 种 情况 下 ， 
你 同时 需要 获取 和 释放 语义 , 因此 memory order acq rel 是 合适 的 , 但 是 你 也 可 以 
使 用 其 他 的 顺序 。 具有 memory_order acquire 语义 的 fetch sub 操作 不 与 任何 东 
西 同步 ， 即 便 是 它 存储 一 个 值 ， 因 为 它 并 不 是 一 个 释放 操作 。 同 样 地 ， 一 次 存储 无 法 与 
具有 memory order release 语义 的 fetch or 操作 同步 ， 因 为 fetch or 的 读 取 
部 分 并 不 是 一 个 获取 操作 。 具 有 memory_order_acq_rel 语义 的 读 - 修 改 - 写 操作 表现 
得 既 像 获取 又 像 释 放 ， 所 以 之 前 的 一 次 存储 可 以 与 这 样 的 操作 同步 ， 并 且 它 也 可 以 与 之 
后 的 一 次 载 人 同步 ， 就 像 这 个 例子 中 的 情况 一 样 。 

如 果 你 将 获取 -释放 操作 与 顺序 一 致 操作 混合 起 来 ， 顺 序 一 致 载 人 表现 的 像 是 获取 
语义 的 载 人 ， 并 且 顺 序 一 致 存储 表现 的 像 是 释放 语义 的 存储 。 顺 序 一 致 的 读 - 修 改 - 写 操 
作 表 现 得 既 像 获取 又 像 释 放 操 作 。 松 散 操作 仍然 是 松散 的 ， 但 是 会 收 到 额外 的 
synchronizes-with 和 随 之 而 来 的 happens-before 关系 的 约束 ， 这 是 由 于 获取 -释放 语义 的 
使 用 而 引入 的 。 

暂且 不 管 可 能 存在 的 不 直观 的 后 果 ， 任 何 使 用 锁 的 人 都 不 得 不 面 对 相同 的 顺序 问 
题 ， 锁 定 互 斥 元 是 一 个 获取 操作 ， 而 解锁 互 斥 元 是 一 个 释放 操作 。 对 于 互 斥 元 ， 你 了 解 
到 必须 确保 当 你 读 取 一 个 值 的 时 候 ， 锁 定 与 你 写 它 时 曾 锁定 的 相同 的 互 斥 元 ， 你 的 获取 
和 释放 操作 必须 是 对 同一 个 变量 以 确保 顺序 。 如 果 数 据 受 到 互 斥 元 的 保护 ， 锁 的 独占 特 
性 意味 着 结果 与 令 它 的 锁定 与 解锁 成 为 顺序 一 致 操作 所 得 到 结果 没有 区 别 。 类 似 地 ， 如 
果 你 在 原子 变量 上 使 用 获取 与 释放 顺序 建立 一 个 简单 的 锁 , 那么 从 使 用 该 锁 的 代码 的 角 
度 来 看 ， 其 行为 会 表现 为 顺序 一 致 ， 即 便 内 部 的 操作 并 非 这 样 。 

如 果 你 对 你 的 原子 操作 不 需要 顺序 一 致 顺序 的 严格 性 ， 获 取 - 释 放 顺 序 的 配对 
同步 可 能 会 比 顺序 一 致 操作 所 要 求 的 全 局 顺序 有 着 低 得 多 的 同步 成 本 。 这 里 需要 权 
衡 的 是 确保 该 顺序 能 够 正确 工作 , 以 及 线程 间 不 直观 的 行为 不 会 出 问题 所 需求 的 脑 
力 成 本 。 


7. 使 用 获取 -释放 顺序 和 MEMORY ORDER CONSUME 的 数据 依赖 


在 本 节 的 绪论 中 我 提 到 了 memory order consume 是 获取 -释放 顺序 模型 的 一 部 
分 , 但 前 面 的 描述 中 它 很 明显 的 缺失 了 。 这 是 因为 memory order consume 是 很 特别 
的 , 它 全 是 关于 数据 依赖 , 它 引 入 了 与 5.3.2 节 中 提 到 的 线程 间 happens-before 关系 有 着 
细微 差别 的 数据 依赖 。 

有 两 个 处 理 数据 依赖 的 新 的 关系 : 依赖 顺序 在 其 之 前 (dependency-ordered-before) 
和 带 有 对 其 的 依赖 (carries-a-dependency-to )。 与 sequenced-before 相似 ，carries-a- 
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dependency-to 严格 适用 于 单个 线程 之 内 ， 是 操作 间 数 据 依赖 的 基本 模型 。 如 果 操 作 A 
的 结果 被 用 作 操 作 B 的 操作 数 ,那么 A 带 有 对 B 的 依赖 ,如 果 操 作 A 的 结果 是 类 似 int 
的 标量 类 型 的 值 ， 那 么 如 果 A 的 结果 存储 在 一 个 变量 中 , 并且 该 变量 随后 被 用 作 操作 B 
的 操作 数 ， 此 关系 也 是 适用 的 。 这 种 操作 也 具有 传递 性 ， 所 以 如 果 A 带 有 对 B 的 依赖 
且 B 带 有 对 C 的 依赖 ， 那 么 A 带 有 对 C 的 依赖 。 

另 一 方面 , dependency-ordered-before 的 关系 可 以 适用 于 线程 之 间 。 它 是 通过 使 用 标 
记 了 memory order consume 的 原子 载 人 操作 引入 的 。 这 是 memory order 
acquire 的 一 种 特例 ， 它 限制 了 对 直接 依赖 的 数据 同步 。 标 记 为 memory order. 
release, memory order acq rel Ej memory order seq cst 的 存储 操作 A 的 
依赖 顺序 在 标记 为 memory order consume 的 载 人 操作 之 前 ,如 果 此 次 消耗 读 取 所 存 
储 值 的 话 。 如 果 载 人 使 用 memory_order_acquire， 那 么 这 与 synchronizes-with 关系 
所 得 到 的 是 相反 的 。 如 果 操 作 B 带 有 对 操作 C 的 某 种 依赖 ， 那 么 A 也 是 依赖 顺序 在 C 
之 前 。 

如 果 这 对 线程 间 happens-before 关系 没有 影响 ， 那 么 在 同步 目的 上 就 无 法 为 你 带 
来 任何 好 处 , 但 它 的 确实 现 了 : 如 果 A 依赖 顺序 在 B 之 前 , W A 也 是 线程 间 发 生 于 B 
之 前 。 

这 种 内 存 顺 序 的 一 个 重要 用 途 ， 是 在 原子 操作 载 人 指向 某 数据 的 指针 的 场合 。 通 过 
在 载 人 上 使 用 memory order consume 以 及 在 之 前 的 存储 上 使 用 memory order. 
release, 你 可 以 确保 所 指向 的 数据 得 到 正确 地 同步 , 无 需 在 其 他 非 依赖 的 数据 上 强加 
任何 同步 需求 。 清 单 5.10 显示 了 这 种 情况 的 例子 。 


清单 5.10 ”使 用 std::memory_order_consume 同步 数据 


struct X 
int ài 
std::string 8$; 
Um 
std: :atomic<X*> p; 
std: :atomic<int> a; 


void create x() 


{ 


X* x=new X; 


x->1i=42; 

x-»8s"hello"; ,9 
a.store(99,std::memory order relaxed); 
p.store(x,std::memory order release); +O 


} 
void use x() 


{ 
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MUN 
while(!(x-p.load(std::memory order consume))) ,9 
std::this thread: :sleep(std::chrono: :microseconds (1) ) ; 


assert (x-»i--42); 0 


assert (x->s=="hello”); 
assert (a.load(std: :memory_order_relaxed) ==99) ; +@ 


int main() 


etd: thread: tl (create x) 5 
Std::thread .t2 (use. x); 
Et. JOm)? 

£2.,360in(Y: 


即使 对 a 的 存储 @ 的 顺序 在 对 o 的 存储 @ 之 前 ， 并 且 对 p 的 存储 被 标记 为 
memory order release, p RAOR memory order _consume。 这 意味 着 ， 
对 Pp 的 存储 只 发 生 在 依赖 p 的 载 入 值 的 表达 式 之 前 。 这 还 意味 着 ， 在 X 结构 的 数据 
成 员 @、@ 上 的 断言 保证 不 会 被 触发 , 因为 p 的 载 人 带 有 对 那些 通过 变量 x 的 表达 式 的 
依赖 。 另 一 方面 , 在 a 的 值 上 的 断言 @ 或 许 会 触发 ,或许 不 被 触发 ， 此 操作 并 不 依赖 于 
A p 载 和 的 值 ， 因 而 对 读 到 的 值 就 没有 保证 。 如 你 所 见 ， 因 为 它 被 标记 为 memory 
order relaxed， 所 以 特别 的 显著 。 

有 时 候 ， 你 并 不 希望 四 处 带 着 依赖 所 造成 的 开销 。 你 想 让 编译 器 能 够 在 寄存 器 中 组 
存 值 ， 并 且 对 操作 进行 重新 排序 以 优化 代码 ， 而 不 用 担心 依赖 。 在 这 些 情形 下 ， 你 可 以 
使 用 std: :kill dependency () 显 式 地 打破 依赖 链条 。std: :kill dependency () 
是 一 个 简单 的 函数 模板 ， 它 将 所 提供 的 参数 复制 到 返回 值 ， 但 这 样 做 会 打破 依赖 链条 。 
例如 ， 如 果 你 有 一 个 全 局 的 的 只 读数 组 ， 你 在 从 另外 的 线程 中 获取 该 数组 的 索引 时 使 用 
J std::memory ordqer_consume， 你 可 以 用 std::kill dependency () 让 编译 
器 知道 它 无 需 重新 读 取 数 组 项 的 内 容 ， 就 像 下 面 的 这 个 例子 。 


int global data[]s( ..}; 
std::atomic<int> index; 
void f() 
{ 
int i-index.load(std::memory order consume); 
do something with(global data[std::kill dependency(i)]); 


) 


当然 ， 在 这 样 一 个 简单 的 场景 里 你 一 般 根本 不 会 使 用 std: memory order. 
consume, ， 但 是 你 可 能 会 在 具有 更 复杂 代码 的 相似 情形 下 调用 ostd::kill_ 
dependency () 。 你 必须 记 住 这 是 一 项 优化 ,所 以 只 应 小 心地 使 用 ,用 在 优化 器 表明 需 
要 使 用 的 地 方 。 

现在 ， 我 已 经 涵盖 了 内 存 顺 序 的 基础 ， 是 时 候 看 看 synchronizes-with 关系 中 更 复杂 
的 部 分 ， 即 体现 为 释放 序列 (release sequence) 的 形式 。 
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5.3.4 释放 序列 和 synchronizes-with 


早 在 5.3.1 节 , 我 提 到 过 你 可 以 在 对 原子 变量 的 载 人 ， 和 来 自 另 一 个 线程 的 对 该 原子 变量 
的 载 人 之 间 ， 建 立 一 个 synchronizes-with 关系 ， 即 便 是 在 存储 和 载 人 之 间 有 一 个 读 -修改 - 写 顺 
序 的 操作 存在 的 情况 下 ， 前 提 是 所 有 的 操作 都 作 了 适当 的 标记 。 现 在 既然 我 已 经 介绍 了 可 能 
的 内 存 顺 序 “ 标 签 " ， 我 就 可 以 详细 解释 这 一 点 。 如 果 存 储 被 标记 为 memory order. 
release, memory order acq rel 或 memory order seq cst, 载 人 被 标记 为 
memory order consume, memory order acquire Bj memory order seq cst, jf 
且 链 条 中 的 每 个 操作 都 载 人 由 之 前 操作 写 和 的 值 ， 那 么 ， 该 操作 链条 就 构成 了 一 个 释放 序列 
(release sequence) ， 并 且 最 初 的 存储 与 最 终 的 载 人 是 synchronizes-with 的 〈 例 如 
memory order acquire 或 memory order seq cst) 或 者 是 dependency-ordered-before 
的 (例如 memory_order_consume)。 该 链条 中 的 所 有 原子 的 读 - 修 改 - 写 操作 都 可 以 具有 任 
意 的 内 存 顺 序 (ZE memory order relaxed), 

要 了 解 这 是 什么 意思 以 及 它 为 什么 很 重要 ， 考 虑 atomic<int> 作 为 在 一 个 共享 的 
队列 中 的 项 目 数量 的 count， 如 清单 5.11 所 示 。 


清单 5.11 使 用 原子 操作 从 队列 中 读 取 值 


#include «atomic» 
#include «thread» 


std::vector<int> queue data; 
std::atomic<int> count; 


void populate queue () 

{ 
unsigned const number_of_items=20; 
queue data.clear(); 
for(unsigned i-0;i«number of items;-«*i) 
{ 


queue_data.push_back (i) ; 


sae 
count . store (number of items,std::memory order release); 存储 
} 
void consume queue items() 一 个 读 -修改 - 
写 操作 


while (true) 

{ 
int item_index; 
if((item index-count.fetch sub(1,std::memory order acquire)):«-0) 
{ 


wait for more items(); 


continue; 等 待 更 多 
项 目 
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} 


process (queue_data[item_index-1]) ; 


读 取 queue_data 是 安 
) 0 全 的 


int main() 


Std::thread a(populate queue); 
std::thread b(consume queue items); 
Std::thread c(consume queue items); 
a.join(); 

bogdein(Q 

avjyoini) 


) 

处 理事 情 的 方法 之 一 是 让 产生 数据 的 线程 将 项 目 存储 在 一 个 共享 的 缓冲 区 中 ， 
然后 执行 count .store (number of items,memory order release)QOil 
其 他 线程 知道 数据 可 用 。 消 耗 队列 项 目的 线程 接着 可 能 会 执行 count. 
fetch sub(1, memory order acquire) @@ 队 列 中 索取 一 个 项 目 ， 在 实际 读 取 
共享 缓冲 区 @ 之 前 。 一旦 count 变 为 零 ， 又 没有 更 多 的 项 目 ， 线 程 就 必须 等 
fre. 

如 果 只 有 一 个 消费 者 线程 ， 这 是 良好 的 。fetch_sub () 是 一 个 具有 memory - 
order acquire 语义 的 读 取 , 并 且 存 储 具 有 memory order release 语义 ， 所 
以 存储 与 载 人 同步 ， 并 且 该 线程 可 以 从 缓冲 区 里 读 取 项 目 。 如 果 有 两 个 线程 在 读 ， 
第 二 个 fetch sub () 将 会 看 到 由 第 一 个 写 下 的 值 , 而 非 由 store 写 下 的 值 。 若 没 
有 该 释放 序列 的 规则 ， 第 二 个 线程 不 会 具有 与 第 一 个 线程 的 happens-before KA, 
并 且 读 取 共 享 缓冲 区 也 不 是 安全 的 ， 除 非 第 一 个 fetch_sub() 也 具有 
memory order release 语义 , 这 会 带 来 两 个 消费 者 线程 之 间 不 必要 的 同步 。 如 
RE fetch sub 操作 上 没有 释放 序列 规则 或 是 memory_order release， 就 没 
有 什么 能 要 求 对 queue data 的 存储 对 第 二 个 消费 者 可 见 , 你 就 会 遇 到 数据 竞争 。 
幸运 的 是 ,第 一 个 fetch sub) 的 确 参与 了 释放 序列 , 并 因此 store () 与 第 二 个 
fetch_sub() 同 步 。 这 两 个 消费 者 线程 之 间 依 然 没 有 synchronizes-with 关系 。 这 
如 图 5.7 所 示 。 图 5.7 中 的 虚线 表示 的 是 释放 序列 ， 实 线 表 示 的 是 happens-before 
关系 。 

在 这 一 链条 中 ， 可 以 有 任意 数量 的 链接 ， 但 前 提 是 它们 都 是 类 似 fetch sub () 这 
样 的 读 - 修 改 - 写 操作 , store () 仍然 与 每 一 个 具有 memory_order acquire 标记 的 操 
作 同 步 。 在 这 个 例子 里 ， 所 有 的 链接 都 是 一 样 的 ， 都 是 获取 操作 ， 但 它们 可 以 由 具有 不 
同 的 内 存 顺 序 语义 的 不 同 操作 组 合 而 成 。 

尽管 大 多 数 的 同步 关系 来 自 于 应 用 到 原子 变量 操作 的 内 存 顺 序 语义 ， 但 通过 屏障 
(fence) 来 引入 额外 的 顺序 约束 也 是 可 能 的 。 
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填充 

queue data 
count.store() 
释放 | 


| 
count. fetch_sub () 

获取 | 
| 

处 理 | | count.fetch sub() 

queue data | | 获取 | 

queue data 
populate queue consume, queue items consume queue items 


图 5.7 清单 5.11 中 队列 操作 的 释放 序列 


5.3.5 ”屏障 


没有 一 套 屏障 的 原子 操作 库 是 不 完整 的 。 这 些 操作 可 以 强制 内 存 顺序 约束 ， 而 无 需 
修改 任何 数据 ,并 且 与 使 用 memory_order relaxed 顺序 约束 的 原子 操作 组 合 起 来 使 
用 。 屏障 是 全 局 操作 ， 能 在 执行 该 屏障 的 线程 里 影响 其 他 原子 操作 的 顺序 。 屏 障 一 般 也 
被 称 为 内 存 障碍 (memory barriers)， 它 们 之 所 以 这 样 命名 ， 是 因为 它们 在 代码 中 放置 
了 二 行 代码 ， 使 得 特定 的 操作 无 法 穿越 。 也 许 你 还 记得 5.3.3 节 中 ， 在 独立 变量 上 的 松 
散 操作 通常 可 以 自由 地 被 编译 器 或 硬件 重新 排序 。 屏 障 限制 了 这 一 自由 ， 并 且 在 之 前 并 
不 存在 的 地 方 引 入 happens-before 和 synchronizes-with 关系 。 

让 我 们 从 在 清单 5.5 中 的 每 个 线程 上 的 两 个 原子 操作 之 间 添 加 屏障 开始 ， 如 清单 
5.12 所 示 。 


清单 5.12 ”松散 操作 可 以 使 用 屏障 来 排序 


#include «atomic» 
#include «thread» 
#include <assert.h> 


std::atomic<bool> x,y; 
std::atomic<int> Z; 


void write x then y() 


x.Store(true,std::memory order relaxed); «9 
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std::atomic thread fence(std::memory order release); 0 
y.store(true,std::memory order relaxed); +9 


} 
void read y then x() 
while(!y.load(std::memory order relaxed)); 
Std::atomic thread fence(std::memory order acquire); 0 


if(x.load(std::memory order relaxed)) 
++2} 


int main() 


x-false; 
y-false; 
zz0; 
std::thread a(write x then y); 
Std::thread b(read y then x); 
a.join(); 
b.join(» 
assert (z.load() !=0) ; 0 
) 


释放 屏障 @ 与 获取 屏障 @ 同 步 ， 因 为 从 y 的 载 人 @ 在 读 取 存 储 在 四 的 值 。 这 意味 着 
对 x 的 存储 @ 发 生 在 从 x 的 载 人 @ 之 前 ,所 以 读 取 的 值 必然 是 ture, 并 且 在 @ 处 的 断 
言 不 会 触发 。 这 与 原来 没有 屏障 的 情况 下 , 对 x 的 存储 和 从 x 的 载 人 没有 顺序 ， 是 相反 
的 ， 所 以 断言 可 以 触发 。 注 意 ， 这 两 个 屏障 都 是 必要 的 ， 你 需要 在 一 个 线程 中 有 一 个 释 
放 ， 在 另 一 个 线程 中 有 一 个 获取 ， 从 而 实现 synchronizes-with KAR, 

在 这 种 情况 下 ,释放 屏 障 @ 的 效果 ,与 对 y 的 存储 目 被 标记 为 memory 
order release FÆ memory order relaxed 是 相似 的 。 EE, 获取 屏障 @ 今 其 
Shy 的 载 人 @ 被 标记 为 memory_order acquire 相似 。 这 是 屏 陪 的 总 体 思 路 : 如 果 
获取 操作 看 到 了 释放 屏障 后 发 生 的 存储 的 结果 ， 该 屏障 与 获取 操作 同步 ， 如 果 在 获取 屏 
障 之 前 发 生 的 载 人 看 到 释放 操作 的 结果 ， 该 释放 操作 与 获取 屏障 同步 。 当 然 ， 你 可 以 在 
两 边 都 设置 屏障 ， 就 像 在 这 里 的 例子 一 样 ， 在 这 种 情况 下 ， 如 果 在 获取 屏障 之 前 发 生 的 
载 人 看 见 了 释放 屏障 之 后 发 生 的 存储 所 写 下 的 值 ， 该 释放 屏障 与 获取 屏障 同步 。 

尽管 屏障 同步 依赖 于 在 屏障 之 前 或 之 后 的 操作 所 读 取 或 写 入 的 值 ， 注意 同步 点 就 是 
屏障 本 身 是 很 重要 的 。 如 果 你 从 清单 5.12 中 将 write x then y RÆ, X} x NSA 
移 到 下 面 的 屏障 之 后 , 断言 中 的 条 件 就 不 再 保证 是 真 的 , 即便 对 x 的 写 人 在 对 y 的 写 人 
之 前 


void write x then y() 

{ 
Std::atomic thread fence(std::memory order release); 
x.Store(true,std::memory order relaxed); 
y.store(true,std::memory order relaxed); 


) 
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这 两 个 操作 不 再 被 屏障 分 隔 ， 所 以 也 不 再 有 序 。 只 有 当 屏 障 出 现在 对 x 的 存储 和 对 
y 的 存储 之 间 时 ， 才 能 施加 顺序 。 当 然 ， 屏 障 的 存在 与 否 并 不 影响 现存 的 ， 由 其 他 原子 
操作 带 来 的 happens-before 关系 所 强制 的 顺序 。 

这 个 例子 中 ， 以 及 本 章 中 目前 为 止 几乎 所 有 其 他 的 例子 ,完全 是 从 具有 原子 类 型 的 
变量 建立 起 来 的 。 然 而 ,使 用 原子 操作 来 强制 顺序 的 真正 优点 ， 是 它们 可 以 在 非 原子 操 
作 上 强制 顺序 ， 并 且 因此 避免 了 数据 竞争 的 未 定义 行为 ， 就 像 之 前 你 在 清单 5.2 中 所 看 
到 的 那样 。 


5.3.6 ”用 原子 操作 排序 非 原子 操作 


如 果 你 将 清单 5.12 中 的 x 替换 为 一 个 普通 的 非 原子 bool 值 ( 如 清单 5.13 所 示 )， 
该 行为 确保 是 相同 的 。 


清单 5.13 ”在 非 原子 操作 上 强制 顺序 


#include «atomic» 

#include «thread» 

#include «assert.h» x 现在 是 一 个 普通 的 非 原 
bool x=false; TZE 


std::atomic<bool> y; 
std::atomic<int> Z; 


void write x then y() es 在 屏障 前 存储 x 
{ 


x=true; 


std::atomic thread fence(std::memory order release); 
y.Store(true,std::memory order relaxed); 


} “é 在 屏障 后 存储 y 
void read y then x() Ae) AGE LSE BHO. 的 


while(!y.load(std::memory order relaxed)); 5A 
std::atomic_thread_fence (std: :memory_order_acquire) ; 
if (x) 

+42; 


} 地 将 读 取 #1 写 人 的 值 


int main() 


x-false; 

y=false; 

Ze0》 

std::thread a(write x then y); 

std::thread b(read y then x); 

a.join(); 

b.join(; 9 此 断言 不 会 触发 


assert (z.load()!20); 
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屏障 仍然 为 对 x 的 存储 @、 对 y 的 存储 @、 从 y MRA © 和 从 x 的 载 人 @ 提供 
了 强制 顺序 ， 并 且 在 对 x 的 存储 和 从 x 的 载 人 之 间 仍 然 有 happens-before 关系 ， 所 以 断 
言 @ 还 是 不 会 触发 。 存 储 @ MRA ey 仍然 必须 是 原子 的 ; 否则 ,在 y 上 就 会 有 数据 
竞争 , 但 是 屏障 在 x 的 操作 上 强制 了 顺序 , 一 旦 读 线程 看 见 了 已 存储 的 y 值 。 这 个 强制 
顺序 意味 着 x 上 没有 数据 竞争 ， 即 使 它 被 一 个 线程 修改 并 且 被 另 一 个 线程 读 取 。 

并 不 是 只 有 屏障 才能 排序 非 原子 操作 。 你 之 前 在 清单 5.10 中 看 到 的 用 
memory order release/memory order consume 对 侦 来 排序 对 动态 分 配对 象 的 
访问 ， 以 及 本 章 中 的 许多 例子 , 都 可 以 通过 将 其 中 一 些 memory order relaxed 操作 
替换 为 普通 的 非 原子 操作 来 进行 重 写 。 

通过 使 用 原子 操作 来 排序 非 原 子 操作 , 是 happens-before 中 的 sequenced-before 部 分 
变 得 如 此 重要 的 所 在 。 如 果 一 个 非 原 子 操作 的 顺序 在 一 个 原子 操作 之 前 ， 同 时 该 原子 操 
作 发 生 于 另 一 个 线程 中 的 操作 之 前 , 这 个 非 原 子 操作 同样 发 生 在 另 一 个 线程 的 该 操作 之 
前 。 这 就 是 清单 5.13 中 x 上 的 操作 顺序 的 来 历 , 也 是 清单 5.2 中 的 示例 可 以 工作 的 原因 。 
这 也 是 C++ 标准 库 中 更 高 级 别 的 同步 功能 的 基础 ， 比 如 互 斥 元 和 条 件 变量 。 想 看 一 看 这 
是 如 何 工作 的 ， 考 虑 一 下 清单 5.1 中 的 简单 的 自 旋 锁 互 斥 元 。 

lock() 操作 是 在 flag.test and set() 上 的 循环 ， 使 用 的 是 
std: :memory order_acquire 顺序 ， 而 unlock() 是 对 flag.clear() 的 调用 ， 
用 的 是 std: :memory_order_release 顺序 。 当 第 一 个 线程 调用 Lock () 时 , 标志 被 
初始 化 为 清除 ， 所 以 第 一 次 调用 test and set () 将 设置 标志 并 返回 false， 表 明 该 
线程 现在 拥有 了 锁 ， 并 且 终 止 循环 。 线 程 接 下 来 就 可 以 自由 地 修改 被 互 斥 元 保护 的 任何 
数据 。 此 时 所 有 其 他 调用 lock () 的 线程 会 发 现 标 志 已 经 被 设置 ， 而 且 会 被 阻塞 在 
test and set () 循环 中 。 

当 持 有 锁 的 线程 已 完成 修改 受 保 护 的 数据 时 ， 它 会 调用 unlock () ,继而 调用 具有 
std::memory order release 语义 的 flag.clear()。 然 后 它 会 与 后 续 的 来 自 另 
一 线程 上 lock () 的 调用 中 的 对 flag.test_and set O 的 调用 同步 ,因为 该 调用 具有 
std: :memory_order_acquire 语 义 , 由 于 对 受 保护 数据 的 修改 必然 顺序 在 unlock () 
之 前 ,于 是 也 就 发 生 在 后 续 的 来 自 于 第 二 个 线程 的 lock) 之 前 (因为 unlock() 和 
lock () 之 间 的 synchronizes-with KA), 并且 发 生 在 来 自 于 第 二 个 线程 的 对 数据 的 任意 
访问 之 前 ,一旦 第 二 个 线程 获取 了 锁 。 

虽然 其 他 的 互 斥 元 的 实现 会 具有 不 同 的 内 部 操作 , 但 其 基本 原理 是 相同 的 , Lock () 
是 在 一 个 内 部 内 存 地 址 上 的 获取 操作 ，unlock () 是 在 相同 内 存 地 址 上 的 释放 操作 。 


小 结 


本 章 介绍 了 C++11 内 存 模型 的 底层 细节 ， 以 及 在 线程 间 提供 同步 基础 的 原子 操作 。 
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这 包括 了 由 std: :atomic<> 类 模板 的 特 化 提供 的 基本 原子 类 型 , 由 std: :atomic<> 
主 模板 提供 的 泛 型 原子 接口 , 在 这 些 类 型 上 的 操作 , 以 及 各 种 内 存 顺 序 选 项 的 复杂 细节 。 
我 们 还 看 了 屏障 ， 以 及 它们 如 何 通 过 原子 类 型 上 的 操作 配对 ， 以 强制 顺序 。 最 
后 ， 我 们 回 到 开头 ， 看 了 看 原子 操作 是 如 何 用 来 在 独立 线程 上 的 非 原子 操作 之 间 强 
制 顺序 的 。 
在 接 下 来 的 章节 中 ， 我们 将 学 习 在 原子 操作 之 外 使 用 高 级 同步 功能 ， 来 为 并 发 访问 
设计 高 效 的 容器 ， 而 且 我 们 会 编写 并 行 处 理 数 据 的 算法 。 
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上 一 章 中 我 们 寻找 原子 操作 和 存储 器 模式 的 底层 细节 。 在 这 一 章 中 ,我 们 先 不 探讨 
底层 细节 (SER 7 章 中 我 们 需要 用 到 它们 ) 而 是 考虑 数据 结构 。 

程序 设计 问题 中 选择 什么 样 的 数据 结构 是 总 体 解决 方法 的 关键 部 分 ,对 于 并 行程 序 
设计 问题 也 不 例外 。 如 果 多 线程 用 到 了 数据 结构 ， 那 么 此 数据 结构 要 么 完全 不 可 变 ， 即 
从 不 发 生变 化 也 不 需要 同步 ， 要 么 程序 设计 中 就 要 保障 线程 间 能 正确 同步 变化 。 一 种 选 
择 就 是 使 用 单独 的 互 斥 元 和 外 部 锁 来 保护 数据 ,使 用 我 们 在 第 3 章 和 第 4 章 中 提 到 的 技 
术 ， 另 外 一 种 选择 就 是 设计 一 个 可 以 同时 访问 的 数据 结构 。 

当 为 并 发 性 设计 数据 结构 时 , 你 可 以 使 用 前 面 章节 中 介绍 的 多 线程 应 用 程序 中 的 基 
本 构造 模块 ,例如 互 斥 元 和 条 件 变 量 。 实 际 上 ， 我们 已 经 看 到 了 几 个 例子 ， 显示 了 如 何 
将 这 些 基本 部 分 组 合 起 来 写 人 数据 结构 并 保证 当前 多 线程 数据 的 安全 性 。 

这 章 中 ,我 们 首先 考虑 为 并 发 性 设计 数据 结构 时 的 一 般 准则 。 然 后 我 们 采取 基本 构 
造 模块 和 条 件 变 量 , 并 且 在 我 们 进入 到 更 加 复杂 的 数据 结构 前 先 回顾 一 下 这 些 基础 数据 
结构 。 在 第 7 SP, 我 们 考虑 如 何 回 到 基础 并 且 使 用 第 5 章 中 描述 的 原子 操作 来 建立 无 
锁 的 数据 结构 。 


6.1 为 并 发 设计 的 含义 是 什么 141 


那么 ， 言 归 正 传 ， 让 我 们 考 虚 为 并 发 性 设计 一 种 数据 结构 时 需要 涉及 到 哪些 方面 。 


6.1 为 并 发 设计 的 含义 是 什么 


在 最 基本 的 层面 ， 为 并 发 设计 数据 结构 意味 着 多 个 线程 可 以 同时 使 用 此 数据 结构 ， 
执行 相同 或 不 同 的 操作 ， 并 且 每 个 线程 都 有 数据 结构 的 一 致 性 视图 。 不 会 丢失 或 破坏 数 
据 , 维持 所 有 不 变量 , 并 且 没 有 不 确定 的 竞争 条 件 , 此 种 数据 结构 就 被 称 为 线程 安全 的 。 
通常 ， 只 有 在 特定 的 并 发 存 取 下 ， 一 种 数据 结构 才 是 安全 的 。 很 有 可 能 出 现 这 种 情况 ， 
就 是 多 个 线程 对 数据 结构 执行 同一 种 操作 ， 然 而 另 一 个 线程 的 操作 需要 进行 独占 访问 。 
或 者 ， 也 许多 个 线程 执行 不 同 的 操作 ， 它 们 并 发 地 存 取 某 个 数据 结构 是 安全 的 。 然 而 多 
个 线程 执行 相同 的 操作 ， 它 们 并 发 地 存 取 某 个 数据 结构 可 能 会 有 问题 。 

实际 上 并 发 设计 远 远 不 只 是 为 多 个 线程 提供 存 取 数 据 结构 的 并 发 机 会 。 本 质 上 , 互 
斥 元 提供 的 是 互 斥 ， 一 次 只 允许 一 个 线程 获取 互 斥 元 的 锁 。 一 个 互 斥 元 通过 明确 阻止 对 
它 所 保护 的 数据 进行 并 发 存 取 来 保护 数据 结构 。 

这 被 称 为 序列 化 (serialization): 多 个 线程 轮流 存 取 互 斥 元 保护 的 数据 ， 它 们 必须 
线性 地 而 非 并 发 地 存 取 数 据 。 所 以 ， 你 必须 仔细 考虑 数据 结构 的 设计 来 实现 真正 的 并 发 
存 取 。 一 些 数据 结构 比 别 的 数据 结构 在 并 发 性 上 有 更 大 的 范围 ， 但 是 在 所 有 的 情况 下 ， 
其 思想 是 一 致 的 ， 更 小 的 保护 区 域 ， 更 少 的 操作 被 序列 化 ， 以 及 更 高 的 并 发 潜能 。 

在 我 们 考虑 某 个 数据 结构 设计 前 , 我 们 先 来 回顾 设计 并 发 性 时 需要 考虑 的 一 些 简单 准则 。 


为 并 发 设计 数据 结构 的 准则 


就 像 我 提 到 的 ， 为 并 发 存 取 设 计数 据 结构 时 ， 你 需要 考虑 两 方面 : 保证 存 取 是 
安全 的 以 及 允许 真正 的 并 发 存 取 。 第 3 章 中 我 阐述 了 如 何 使 得 数据 结构 线程 安全 的 
基本 原理 。 

图 ”保证 当 数 据 结构 不 变性 被 别 的 线程 破坏 时 的 状态 不 被 任何 别 的 线程 看 到 。 

加 ”注意 避免 数据 结构 接口 所 固有 的 竞争 现象 ， 通 过 为 完整 操作 提供 函数 ， 而 不 是 

提供 操作 步骤 。 

E ”注意 当 出 现 例外 时 ， 数 据 结 构 是 怎样 来 保证 不 变性 不 被 破坏 的 。 

加 ” 当 使 用 数据 结构 时 ， 通过 限制 锁 的 范围 和 避免 使 用 谋 套 锁 ， 来 降低 产生 死 锁 的 机 会 。 

在 考虑 这 些 细节 前 ， 先 考虑 使 用 数据 结构 时 的 限制 条 件 也 是 很 重要 的 ， 如 果 一 个 函 
数 通 过 特殊 函数 使 用 数据 结构 ， 那 么 其 他 线程 调用 哪个 函数 是 安全 的 ? 

这 是 要 考虑 的 关键 性 问题 。 大 多 数 构造 函数 和 析 构 函数 需要 以 独占 方式 访问 数据 结 
构 ， 但 是 需要 使 用 者 保证 它们 在 构造 函数 完成 前 或 者 析 构 函数 开始 后 没有 被 使 用 。 如 果 
数据 结构 支持 赋值 、swap () 、 或 复制 构造 ， 那 么 作为 数据 结构 的 设计 者 ， 就 需要 决定 
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6.2 


6.2.1 


第 6 章 设计 基于 锁 的 并 发 数据 结构 


这 些 操 作 与 别 的 操作 同时 被 调用 时 是 否 安 全 , 或 者 是 否 需 要 使 用 者 保证 互 斥 访问 ， 即 使 
操作 数据 结构 的 大 部 分 函数 可 能 被 多 线程 同时 访问 时 没有 问题 。 

第 二 个 要 考虑 的 方面 就 是 实现 真正 的 并 发 存 取 。 我 没 办 法 在 这 里 给 出 详尽 的 准则 ， 
而 是 ， 这 里 有 一 列 问 题 ， 作 为 数据 结构 设计 者 需要 问 问 你 自己 。 

Wo ” 锁 的 范围 能 否 被 限定 ， 使 得 一 个 操作 的 一 部 分 可 以 在 锁 外 被 执行 ? 

图 ”数据 结构 的 不 同 部 分 能 否 被 不 同 的 互 斥 元 保护 ? 

图 ”是否 所 有 操作 需要 同样 级 别 的 保护 ? 

图 ”数据 结构 的 一 个 小 改变 能 否 在 不 影响 操作 语义 情况 下 提高 并 发 性 的 机 会 ? 

所 有 这 些 问题 都 被 一 个 想法 所 指导 : 如 何 能 够 最 小 化 必然 发 生 的 序列 化 ， 并 且 能 够 
最 大 限度 地 实现 并 发 性 ? 通常 当 多 个 线程 仅仅 读 取 数据 结构 时 可 以 并 发 访问 此 数据 结 
构 ， 但 是 一 个 线程 必须 以 独占 方式 修改 数据 结构 。 使 用 构造 函数 boost::shared_ 
mutex 可 以 实现 此 功能 。 而且, 很 快 你 就 会 看 到 , 数据 结构 支持 执行 不 同 操作 的 线程 和 
执行 相同 操作 的 序列 化 线程 并 发 访问 它 。 

最 简单 的 线程 安全 数据 结构 通常 使 用 互 斥 元 和 锁 来 保护 数据 。 就 像 第 3 章 中 提 到 的 ， 
比较 简单 的 方式 是 保证 每 次 只 有 一 个 线程 使 用 此 数据 结构 ， 尽 管 这 种 方式 也 会 存在 问 
题 。 为 了 让 你 轻松 了 解 线程 安全 数据 结构 的 设计 , 本 章 我 们 研究 这 种 基于 锁 的 数据 结构 ， 
在 第 7 章 中 我 们 将 研究 无 锁 的 并 发 数据 结构 的 设计 。 


基于 锁 的 并 发 数据 结构 


设计 基于 锁 的 并 发 数据 结构 关键 是 要 确保 存 取 数据 时 要 锁 住 正确 的 互 斥 元 ， 并 且 要 
确保 将 锁 的 时 间 最 小 化 。 只 用 一 个 互 斥 元 保护 一 个 数据 结构 是 很 困难 的 。 你 需要 确保 此 
数据 在 互 斥 锁 保护 区 域 之 外 不 会 被 存 取 ， 并 且 不 会 发 生 接口 所 固有 的 竞争 现象 。 如 果 使 
用 独立 的 互 斥 元 来 保护 数据 结构 的 独立 部 分 ， 问 题 会 变 得 更 复杂 ， 并 且 如 果 数 据 结构 上 
的 操作 需要 多 个 互 斥 元 被 锁 住 就 有 可 能 产生 死 锁 。 因 此 ， 设 计 有 多 个 互 斥 元 的 数据 结构 
时 ， 需 要 比 设计 只 有 一 个 互 斥 元 的 数据 结构 考虑 得 更 细致 。 

在 这 部 分 ， 将 6.1.1 节 中 的 准则 运用 到 一 些 简单 数据 结构 的 设计 中 ， 使 用 互 斥 元 和 
锁 来 保护 数据 。 在 不 同 的 情况 下 ， 你 可 以 找到 机 会 在 确保 数据 结构 仍然 线程 安全 的 情况 
下 能 够 有 更 大 的 并 发 性 。 

首先 我 们 回顾 一 下 第 3 章 中 提 到 的 栈 实现 ， 这 大 约 是 最 简单 的 一 种 数据 结构 ， 而 且 它 
只 是 使 用 了 一 个 互 斥 元 。 它 是 否 真 的 线程 安全 ? 它 距 离 实现 真正 的 并 发 性 到 底 有 多 远 呢 ? 


使 用 锁 的 线程 安全 栈 
在 清单 6.1 中 会 重 现 第 3 章 中 的 线程 安全 栈 。 目 的 是 为 std: :stack<> 写 一 个 相似 


6.2 ”基于 锁 的 并 发 数据 结构 
的 线程 安全 数据 结构 ， 支 持 数据 人 栈 和 出 栈 。 


清单 6.1 ”线程 安全 栈 的 类 定义 
#include «exception» 


struct empty stack: std::exception 


{ 
hy 


template<typename T> 
class threadsafe_stack 
{ 
private: 
std::stack<T> data; 
mutable std::mutex m; 
public: 
threadsafe stack()() 
threadsafe stack(const threadsafe stack& other) 


const char* what() const throw(); 


{ 
std::lock_guard<std: :mutex> lock (other.m) ; 
data=other.data; 

} 

threadsafe stack& operator=(const threadsafe stack&) = delete; 


void push(T new value) 


{ 


std::lock guard«std::mutex» lock (m); 
data.push(std::move(new value)); +@ 


} 


std::shared_ptr<T> pop() 


{ 


std::lock_guard<std: :mutex> lock (m); 


if (data.empty()) throw empty stack(); -© 
std::shared ptr<T> const res( 
std::make shared«T» (std: :move(data.top())))j +9 


data.pop(); 

return res; Ò 
) 
void pop(T& value) 


{ 


std: :lock_guard<std: :mutex> lock (m); 


if (data.empty()) throw empty stack(); 
valuesstd::move (data.top()); +@ 
data.pop(); 


) 


bool empty() const 


{ 


std: :lock_guard<std: :mutex> lock (m); 
return data.empty(); 
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让 我 们 轮流 看 看 每 个 准则 ， 以 及 它们 是 如 何 应 用 的 。 

首先 ， 如 你 所 见 ， 基 本 的 线程 安全 是 通过 使 用 互 斥 锁 m 保护 成 员 函 数 来 实现 的 。 这 
就 确保 了 同一 时 间 只 有 一 个 线程 在 存 取 数 据 ， 因 此 每 个 成 员 函 数 都 保持 了 不 变量 ,没有 
线程 会 看 到 一 个 破坏 的 不 变量 。 

其 次 ，empty() 和 任何 一 个 pop O 函数 间 都 可 能 产生 竞争 条 件 ， 但 是 当 pop O 持 
有 锁 的 时 候 ， 这 段 代码 会 明确 地 检查 它 所 包含 的 栈 ， 因 此 竞争 条 件 就 不 成 问题 了 。 调 用 
pop () 时 会 直接 返回 出 栈 的 数据 项 ， 就 避免 了 类 似 于 std: :stack<> 中 单独 的 成 员 函 
BM top () 和 Pop O 间 可 能 产生 的 竞争 条 件 。 

下 一 个 ,这 里 可 能 会 抛 出 一 些 异 常 。 锁 住 一 个 互 斥 元 可 能 会 抛 出 异常 ， 这 不 仅 是 极 
其 罕见 的 〈 因 为 这 就 表明 互 斥 元 有 问题 或 者 缺乏 系统 资源 ) ， 也 是 每 个 成 员 函 数 的 第 一 
个 操作 。 因 为 没有 数据 被 修改 ， 所 以 是 安全 的 。 解 锁 一 个 互 斥 元 总 是 成 功 的 ， 所 以 总 是 
安全 的 ， 并 且 使 用 std: :lock_guard<> 保 证 了 在 成 员 函 数 结束 的 时 候 互 斥 元 不 会 被 
锁定 。 

调用 data.push () @ 可 能 会 抛 出 异常 , 如 果 复 制 或 者 移动 数据 项 抛 出 异常 或 者 不 
能 分 配 足够 的 内 存 来 扩展 下 层 的 数据 结构 。 不 管 怎 样 ，std: :stack<> 保 证 了 它 是 安全 
的 ， 因 此 这 也 不 是 一 个 问题 。 

在 函数 pop O 重 载 的 第 一 种 形式 中 ， 它 的 代码 可 能 会 抛 出 一 个 empty stack 
异常 @@， 但 是 没有 做 任何 修改 ， 因 此 它 是 安全 的 。 创 建 res@ 时 因为 一 些 原因 可 能 会 
抛 出 异常 : 调用 std::make shared 可 能 会 抛 出 异常 ， 因 为 它 无 法 为 新 对 象 和 需要 引 
用 计数 的 内 部 数据 分 配 内 存 。 当 复制 构造 函数 或 移动 构造 函数 中 返回 的 数据 项 被 复制 / 
移动 到 新 分 配 的 内 存 时 也 可 能 会 抛 出 异常 。 在 这 两 种 情况 下 ，C++ 运 行 库 和 标准 库 确 保 
没有 内 存 泄 露 并 且 新 对 象 (如 果 存 在 的 话 ) 被 正确 销毁 。 因 为 你 仍然 没有 修改 下 层 的 栈 ， 
所 以 没有 问题 。 作 为 结果 的 返回 值 ， 调 用 data.popO @ 保证 了 不 会 抛 出 异常 ， 因 此 
pop () 的 重 载 是 异常 安全 的 。 

函数 Pop O 重 载 的 第 二 种 形式 是 类 似 的 , 只 不 过 这 次 是 拷贝 赋值 或 移动 赋值 操作 符 
抛 出 异常 @， 而 不 是 构造 新 对 象 和 一 个 std: :shared_ptz 实例 抛 出 异常 。 同 样 ， 你 
实际 上 并 没有 修改 数据 结构 直到 调用 data. pop 0 6, 这 仍然 保证 了 不 会 抛 出 异常 ， 因 
此 这 一 重 载 也 是 异常 安全 的 。 

最 后 ，empty () 不 修改 任何 数据 ， 因 此 是 异常 安全 的 。 

这 里 会 有 产生 死 锁 的 可 能 ， 因 为 当 持 有 锁 时 调用 了 用 户 代码 ; 拷贝 构造 函数 或 移动 
构造 函数 @、 日 ， 以 及 内 含 数 据 项 的 拷贝 赋值 操作 或 移动 赋值 操作 @， 以 及 可 能 由 用 户 
定义 的 new 操作 符 。 如 果 当 数据 项 被 插入 栈 或 从 栈 中 移出 时 , 这 些 函 数 调 用 了 栈 的 成 员 
函数 ， 或 者 当 栈 成 员 函 数 被 调用 时 ， 这 些 函 数 请 求 一 个 锁 的 时 候 保 持 着 另 一 个 锁 ， 就 有 
可 能 产生 死 锁 。 然 而 ， 要 求 栈 的 使 用 者 做 出 如 下 保证 是 明智 的 : 你 不 能 理所当然 地 在 没 
有 复制 数据 项 或 为 之 分 配 内 存 的 情况 下 ， 将 它 加 入 栈 或 者 从 栈 中 移 走 它 。 
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因为 所 有 的 成 员 函 数 都 使 用 std: :lock_guard<> 来 保护 数据 ， 所 以 多 个 线程 调 
用 stack 的 成 员 函 数 是 安全 的 。 成 员 函 数 中 只 有 构造 函数 和 析 构 函数 是 不 安全 的 ， 但 
是 这 不 是 一 个 特殊 问题 ， 对 象 只 能 被 构造 和 销毁 一 次 。 在 一 个 没有 完全 构造 好 的 对 象 或 
部 分 析 构 对 象 上 调用 成 员 函 数 永 远 都 不 是 一 个 好 主意 。 因 此 ， 使 用 者 必须 保证 在 它 被 完 
全 构造 前 别 的 线程 不 能 存 取 栈 ， 并 且 在 它 被 完全 销毁 前 ， 所 有 线程 结束 存 取 栈 。 

尽管 对 多 线程 来 说 ， 因 为 使 用 了 锁 ， 每 次 只 有 一 个 线程 对 栈 数据 结构 进行 操作 ， 所 
以 同时 调用 成 员 函 数 是 安全 的 。 但 是 当 stack 上 存在 显著 的 竞争 时 ， 线 程序 列 化 可 能 
会 限制 应 用 的 性 能 。 当 一 个 线程 在 等 待 锁 的 时 候 ， 它 就 做 不 了 任何 有 用 的 工作 。 并 且 ， 
栈 没有 为 等 待 数据 项 被 插入 的 线程 提供 任何 方式 的 准备 ， 因 此 如 果 一 个 线程 需要 等 符 ， 
它 就 会 反复 地 调用 empty O ， 或 者 只 是 调用 pop () ， 并 且 捕 所 empty stack 异常 。 
如 果 这 种 情况 发 生 的 话 ， 这 种 栈 实现 就 成 为 一 个 比较 糟糕 的 选择 ， 因 为 一 个 等 待 中 的 线 
程 要 么 消耗 宝贵 的 资源 在 检查 数据 上 ， 要 么 用 户 必须 写 外 部 的 等 竺 和 通知 代码 〈 比 如 ， 
使 用 条 件 变量 ) ， 而 这 就 有 可 能 让 内 部 锁 变 得 无 效 并 且 造 成 浪费 。 第 4 章 中 的 队列 在 数 
据 结构 中 使 用 了 条 件 变 量 ， 这 就 提供 了 一 种 数据 结构 中 包含 等 待 的 方法 。 因 此 下 面 我 们 
来 看 一 看 。 


6.2.2 ”使 用 锁 和 条 件 变 量 的 线程 安全 队列 


清单 6.2 中 重 现 了 第 4 章 中 提 到 的 线程 安全 队列 。 类 似 于 栈 是 以 std: : stack<> 
建 模 的 ， 队 列 是 以 std: : queue<> 来 建 模 的 。 此 外 ， 它 的 接口 与 标准 容器 适配器 的 
接口 是 不 同 的 ， 因 为 它 要 满足 其 数据 结构 对 于 来 自 多 线程 的 并 发 访问 是 安全 的 这 一 
AR. 


清单 6.2 ”使 用 条 件 变量 的 线程 安全 队列 的 完整 类 定义 


template«typename T» 
class threadsafe queue 


private: 
mutable std::mutex mut; 
Std::queue«T» data queue; 
std::condition variable data cond; 
public: 
threadsafe queue () 


void push(T new value) 

{ 
std::lock guard«std::mutex» lk (mut) ; 
data_queue.push (std: :move (data) ) ; 
data cond.notify one(); 


) 
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void wait and pop(T& value) 0 
{ 
Std::unique lock«std::mutex» lk(mut); 
data cond.wait (1k, [this] (return !data queue.empty();)); 
value=std: :move (data queue.front()); 
data queue.pop(); 


Std::shared ptr«T» wait and pop() -© 


Std::unique lock«std::mutex» 1k(mut) ; 
data cond.wait(lk, [this] {return !data queue.empty();]); <0 
Std::shared ptr«T» res ( 
std: :make_shared<T> (std: :move (data_queue.front ()))); 
data queue.pop(); 
return res; 


) 


bool try pop(T& value) 

{ 
Std::lock guard«std::mutex» lk(mut); 
if (data_queue.empty () ) 

return false; 

value=std: :move (data_queue. front ()) ; 
data queue.pop(); 
return true; 


Std::shared ptr«T» try pop() 


Std::lock guard«std::mutex» lk(mut); 
if (data_queue.empty () ) 

return std::shared_ptr<T>() ; 0 
std::shared_ptr<T> res ( 

std: :make_shared<T> (std: :move (data_queue. front ()))); 
data queue.pop(); 
return res; 


) 


bool empty() const 


l Std::lock guard«std::mutex» 1k (mut); 
return data queue.empty(); 

Hap 

清单 6.2 中 所 示 的 队列 实现 的 结构 与 清单 6.1 中 所 示 的 栈 的 结构 是 类 似 的 ， 除 了 
push () 0 中 调用 的 data cond.notify one() 以 及 wait and pop O MAW e, 6, 
try pop O 的 两 种 重 载 形式 与 清单 6.1 中 的 pop O 函数 的 两 种 重 载 形式 基本 上 是 相同 
的 ， 区 别 在 于 当 队 列 为 空 的 时 候 ，try_pop () 函数 不 引发 异常 。try_pop O 函数 要 么 
返回 一 个 表明 是 否 取 回 一 个 值 的 bool 值 ， 要 人 么 在 返回 指针 的 重 载 @ 没 能 取 到 值 的 时 候 
返回 NULL， 这 也 是 实现 栈 的 有 效 方式 。 因 此 ， 如 果 不 包 括 wait and pop O KX, X 
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栈 应 用 所 做 的 分 析 同 样 适用 此 。 

新 的 wait and pop () 函数 是 一 种 解决 等 待 队列 人 口 问题 的 方法 ， 与 反复 调用 
empty O 函数 不 同 ， 等 待 中 的 线程 可 以 通过 调用 wait and pop () 函数 ， 然 后 数据 结 
构 使 用 条 件 变量 来 处 理 这 种 等 待 状态 。 对 data cond.wait O 的 调用 直到 下 层 队 列 中 

至 少 有 一 个 元 素 时 ， 才 会 返回 ， 因 此 你 不 用 担心 在 代码 的 这 个 地 方 队列 为 空 的 可 能 性 ， 
数据 仍然 被 互 斥 元 上 的 锁 保护 着 。 这 些 函 数 不 会 增加 任何 新 的 竞争 条 件 和 死 锁 的 可 能 
性 ， 并 且 维持 了 不 变量 。 

当 一 个 元 素 进入 队列 时 ， 如 果 不 止 一 个 线程 处 于 等 待 状态 ， 关 于 异常 安全 就 会 有 点 
WR, 只 有 一 个 线程 会 被 data cond.notify one () 的 调用 唤醒 。 然而, 如 果 被 唤醒 
的 线程 在 wait_and_pop () 中 引发 异常 ， 例 如 构造 std: :shared_ptr<> 的 时 候 e, 
那么 就 没有 线程 将 被 唤醒 。 如 果 不 能 接受 这 一 点 ， 那 么 可 以 用 data_cond.notify_ 
all () 来 代替 data cond.notify one () , 前 者 将 唤醒 所 有 在 等 待 的 线程 , 代价 就 是 
当 最 后 它们 发 现 队列 为 空 的 时 候 ， 其 中 的 大 部 分 线程 都 要 重新 进入 睡 卢 状态。 第 二 种 葵 
代 方 法 就 是 ， 当 引发 异常 的 时 候 ， 让 wait_and_pop () 调 用 notify one O ， 这 样 另 
外 一 个 线程 可 以 尝试 获取 所 存储 的 值 。 第 三 种 将 代 方 法 ， 是 将 std::shared_ptr<> 
的 初始 化 移动 到 push O 调用 ， 并 且 存储 std: :shared_ptr<> 实 例 而 不 是 直接 存储 
值 。 将 内 部 的 std: :queue<> 复 制 到 std: :shared ptr<> 并 不 会 引发 异常 ， 因 此 
wait and pop () 又 是 安全 的 了 。 清单 6.3 展示 了 使 用 这 一 思想 重新 修订 以 后 的 队列 
实现 。 


清单 6.3 包含 std::shared_ptr<> 实 例 的 线程 安全 队列 


template<typename T> 
class threadsafe queue 


private: 
mutable std::mutex mut; 
std::queue<std::shared_ptr<T> > data queue; 
std: :condition variable data cond; 

public: 
threadsafe_queue () 


void wait_and_pop(T& value) 


std: :unique_lock<std::mutex> 1k (mut) ; 

data_cond.wait (1k, [this] {return !data queue.empty 0 ;)) ; 
value-std::move(*data queue.front()); 

data queue.pop(); 0 


) 


bool try pop(T& value) 
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std::lock guard<std: :mutex> lk (mut); 
if (data queue.empty () ) 
return false; 
value=std: :move (*data_queue.front()) ; +O 
data queue.pop(); 
return true; 


Std::shared ptr«T» wait and pop() 


Std::unique lock«std::mutex» lk(mut); 

data cond.wait (1k, [this] (return !data queue.empty();)); 
Std::shared ptr«T» res-data queue.front(); 

data queue.pop(); “Ò 
return res; 


std: shared ptr«T» try pop() 


Std::lock guard«std::mutex» 1k (mut); 
if(data queue.empty()) 
return std::shared ptr«T5(); 
std::shared ptr«T» res-data queue.front(); 0 
data queue.pop(); 
return res; 


) 


void push(T new value) 


Std::shared ptr«T» data( 
Std::make shared«T» (std: :move (new value))); 0 
Std::lock guard«std::mutex» lk (mut); 
data queue.push (data) ; 
data cond.notify one(); 


) 


bool empty() const 


{ 


std: :lock_guard<std::mutex> lk (mut); 
return data_queue.empty () ; 


} 
}; 

通过 std: :shareq_ptr<> 持 有 数据 的 基本 效果 是 直观 的 ; 接受 一 个 对 变量 的 引 
用 来 获取 新 值 的 pop 函数 ， 现 在 必须 得 解 引用 所 存储 的 指针 @、@ ， 返 回 一 个 
std::shared ptr<> 实 例 的 pop 函数 可 以 在 返回 调用 前 从 队列 中 取得 这 个 数 e. 9. 

如 果 数 据 由 std: :shared_ptr<> 持 有 , 那么 有 一 个 额外 的 好 处 : 可 以 在 push () 
的 锁 外 面 完成 此 新 实例 的 分 配 O, 然而 在 清单 6.2 中 ,就 必须 在 pop O 持 有 锁 的 情况 下 
才能 这 样 做 。 因 为 内 存 分 配 通 常 是 很 昂贵 的 操作 ， 这 种 方式 就 有 助 于 提高 队列 的 性 能 ， 
因为 它 也 减少 了 持 有 互 斥 元 的 时 间 ， 人 允许 其 他 线程 同时 在 队列 上 执行 操作 。 

就 像 之 前 栈 的 例子 一 样 ， 使 用 互 斥 元 来 保护 整个 数据 结构 限制 了 队列 所 支持 的 并 
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发 。 尽 管 多 个 线程 可 能 在 不 同 的 成 员 函 数 中 被 阻塞 ， 但 是 一 次 只 有 一 个 线程 可 以 进行 操 
作 。 尽 管 如 此 ， 部 分 限制 来 自 于 在 实现 中 使 用 std: :queue<>， 通过 使 用 标准 容器 ， 
你 基本 上 有 了 一 个 受到 保护 或 者 没 受到 保护 的 数据 项 。 通 过 控制 数据 结构 的 详细 实现 ， 
可 以 提供 更 细 粒 度 的 锁定 ， 并 且 实 现 更 高 级 别 的 并 发 。 


尾 
ea 


图 6.1 用 单 链表 表示 的 队列 


6.2.3 ”使 用 细 粒 度 锁 和 条 件 变量 的 线程 安全 队列 


在 清单 6.2 和 清单 6.3 中 ， 有 一 个 被 保护 的 数据 项 (data queue) 和 一 个 互 斥 元 。 
为 了 使 用 细 粒 度 锁 ， 你 需要 瞧 一 瞧 队 列 的 组 成 部 分 ， 并 且 将 一 个 互 斥 元 与 每 个 不 同 的 数 
据 项 联系 起 来 。 

实现 队列 最 简单 的 数据 结构 为 单 链表 ， 如 图 6.1 所 示 。 队 列 包含 一 个 头 〈head) fü 
针 ， 指 向 链表 的 第 一 项 ， 并 且 每 一 项 都 指向 下 一 项 。 将 数据 项 从 队列 中 移 走时 ， 首 先 将 
头 指针 指向 下 一 个 数据 项 ， 然 后 返回 以 前 头 指 针 所 指向 的 数据 项 。 

数据 项 被 添加 到 队列 的 另 一 端 。 为 了 实现 这 一 点 ， 队 列 还 包含 一 个 尾 CtaiD 指针， 
指向 链表 的 最 后 一 项 。 通 过 将 最 后 一 项 的 next 指针 指向 新 结 点 ， 然 后 将 尾 指针 更 新 为 
指向 新 的 一 项 ， 可 以 实现 添加 结 点 。 当 链表 为 空 时 ， 头 指针 和 尾 指针 均 为 NULL。 

清单 6.4 展示 了 这 种 队列 的 简单 实现 ， 基 于 清单 6.2 中 队列 接口 的 缩减 版 本 。 因 为 
此 队列 只 支持 单线 程 使 用 ， 因 此 只 需要 一 个 try pop O RR, MRA 


wait and Pop () 。 


清单 6.4 一 种 简单 的 单线 程 队列 实现 


template<typename T> 
class queue 


private: 
struct node 


T data; 
std: :unique ptr«node» next; 


node(T data ): 
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data(std::move(data )) 
0 
E 


std: :unique_ptr<node> head; 0 


node* tail; 0 
public: 


queue () 
{} 


queue (const queue& other) =delete; 
queue& operator-(const queue& other) =delete; 


std::shared_ptr<T> try_pop() 


{ 


if (!head) 


return std::shared_ptr<T>(); 
} 
std::shared_ptr<T> const res ( 
std: :make_shared<T> (std: :move (head->data) ) ) ; 
std: :unique_ptr<node> const old_head=std: :move (head); 
head=std: :move (old_head->next) ; 
return res; Ò 


) 


void push(T new value) 

{ 
std::unique_ptr<node> p(new node (std: :move (new Value) ) ) ; 
node* const new_tail=p.get(); 


if (tail) 
{ 
tail-»next-std::move (p); <0 
} 
else 
{ 
head=std: :move (p) ; «9 
} 
tail=new_tail; +@ 


首先 ， 要 注意 清单 6.4 使 用 了 std: :unique ptr<node> 来 管理 结 点 ， 因 为 这 
可 以 保证 当 结 点 不 再 需要 时 ， 它 们 (以 及 它们 指向 的 数据 ) 能 被 删除 ， 而 无 需 显 式 
地 编写 delete。 所 有 者 链表 从 head 开始 管理 ， 指 向 最 后 一 个 结 点 的 tail 是 个 裸 
指针 。 

尽管 在 单线 程 环境 中 这 种 实现 方式 可 以 良好 地 工作 ， 但 是 如 果 在 多 线程 环境 下 
试图 使 用 细 粒 度 锁 ， 就 会 带 来 问题 。 假 定 有 两 个 数据 项 (head@ 和 tail1@)， 原 则 
上 可 以 使 用 两 个 互 斥 元 ， 一 个 用 来 保护 head， 另 一 个 用 来 保护 tail, BÆRES 
存在 一 些 问题 。 

最 明显 的 问题 就 是 ，push () 可 以 修改 head@ 和 tail@， 因 此 它 就 需要 锁 住 
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这 两 个 互 斥 元 。 虽 然 倒霉 ， 但 也 不 是 什么 大 问题 ， 因 为 锁 住 两 个 互 斥 元 是 可 能 的 。 
关键 的 问题 是 ，push () 和 pop O 都 要 访问 某 个 结 点 的 next Hér. push O 更 新 
tail-»nextO, try pop () 读 取 head->next@。 如 果 队 列 中 只 有 一 个 结 点 ， 那 
Z head==tail, Bl head->next fil tail-»next 是 同一 个 的 对 象 ， 因 而 需要 保 
护 。 因 为 还 没 读 取 head 和 tail 时 , 你 无 法 分 辨 它们 是 否 为 同一 个 对 象 ， 你 就 必须 
在 push() 和 try_pop () 中 锁定 同一 个 互 斥 元 ， 所 以 没有 比 以 前 做 得 更 好 。 有 没有 
办 法 摆脱 这 一 困境 呢 ? 


1. 通过 分 离 数据 允许 并 发 


可 以 通过 预先 分 配 一 个 不 存储 数据 的 倪 偶 结 点 ， 以 保证 了 队列 中 总 是 至 少 会 有 一 个 
结 点 ， 将 在 头 尾 的 两 个 访问 分 开 ， 来 解决 这 个 问题 。 对 于 一 个 空 队列 ，heaqg 和 tail 
都 指向 这 个 倪 偶 结 点 , 而 不 是 NULL, 这 样 就 没 问题 了 , 因为 如 果 当 队列 为 空 , try_pop O 
不 会 访问 head->next。 当 你 将 一 个 结 点 加 入 队列 (于 是 就 有 一 个 真正 的 结 点 )，head 
All tail 就 指向 不 同 的 结 点 ， 因 此 在 head->next fll tail->next 上 就 不 存在 竞争 。 
缺点 是 ， 必 须 添加 一 个 额外 的 间接 层 ， 通 过 指针 存储 数据 ， 以 便 允许 假 结 点 。 清 单 6.5 
展示 该 实现 现在 的 样子 。 


清单 6.5 ”使 用 货 偶 结 点 的 简单 队列 


template<typename T» 
class queue 


private: 
struct node 


{ 
std::shared_ptr<T> data; 0 
Std::unique ptr«node» next; 

a 

std: :unique ptr«node» head; 

node* tail; 


public: 


queue () : 
head(new node),tail(head.get 0) <+@ 


queue(const queue& other) =delete; 
queue& operator- (const queue& other)-delete; 


std::shared ptr«T» try pop() 
{ 
if (head.get () ==tail) -© 


return std::shared ptr«T»(); 


) 
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Std::shared ptr«T» const res(head-»data); 
Std::unique ptr«node» old head-std::move (head); 
head-std::move(old head-»next); 


return res; 0 
} 


void push(T new_value) 
std::shared ptr<T> new_data ( 
std: :make_shared<T> (std: :move (new value))); +@ 
std::unique ptr«node» p(new node); 
tail-»data-new data; 


node* const new tail-p.get(); 
tail-»next-std::move (p); 


tail-new tail; 


) 


Xf try pop O 的 改变 是 很 小 的 。 首 先 ， 是 比较 head 与 tai1@, 而 不 是 检查 其 是 
A NULL, Ay te fit i ROKR head 不 可 能 是 NULL, Aly head 是 一 个 
std: :unique ptr<node>, 你 需要 调用 head. get () 来 进行 比较 。 其 次 , 因为 node 
现在 是 通过 指针 来 存储 数据 的 @， 所 以 可 以 直接 获取 指针 @ 而 不 必 构造 了 的 一 个 新 实 
例 。 最 大 改变 是 在 push) H, UMELY T 的 一 个 新 实例 ， 并 且 在 
std: :shared ptr<>@ 中 取得 其 所 有 权 (使 用 std: :make shared 是 为 了 避免 第 二 
次 为 引用 计数 分 配 内 存 的 开销 )。 你 创建 的 新 结 点 将 会 作为 新 的 例 偶 结 点 ， 因 此 无 需 向 构 
造 函数 提供 new_value@。 取 而 代 之 的 是 ， 将 旧 的 倪 偶 结 点 上 的 数据 设置 为 新 分 配 的 
new value 的 副本 @。 最 后 ， 为 了 得 到 一 个 做 偏 结 点 ， 你 必须 在 构造 函数 中 创建 它 ©. 

到 目前 为 止 , 我 敢 肯 定 你 想 知 道 这 些 变 化 为 你 带 来 了 什么 ， 并 如 何 让 队列 变 得 线程 
KE. WE, push () 现在 只 访问 tail, 不 访问 head， 这 是 一 个 改进 。try_pop () 
既 访 问 head 又 访问 tail, 但 只 要 在 最 初 的 比较 中 需要 tail ,因此 这 个 锁 是 很 短暂 的 。 
最 大 的 收获 就 是 ， 俐 仿 结 点 意味 着 try_pop () 和 push () 不 会 在 同一 个 结 点 上 进行 操 
作 ， 因 此 不 再 需要 一 个 包含 一 切 的 互 斥 元 。 因 此 ， 你 可 以 为 head fl tail 各 设置 一 个 
互 斥 元 。 那 锁 应 该 放 在 哪 呢 ? 

我 们 的 目标 是 实现 最 大 程度 的 并 发 , 因此 希望 持 有 锁 的 时 间 尽 可 能 的 短 。 push () 比较 
简单 : 互 斥 元 在 访问 tail 的 全 程 都 需要 被 锁定 , 这 意味 着 应 该 在 新 节点 被 分 配 好 之 后 @ 以 
及 为 当前 的 尾 结 点 分 配 数 据 之 前 @ ， 锁 定 互 斥 元 。 该 锁定 需要 一 直 持 有 到 函数 结束 。 

try pop () 就 没 那么 简单 了 。 首 先 ， 你 需要 锁定 head 上 的 互 斥 元 ， 并 持 有 它 直到 
head 使 用 完毕 。 本 质 上 ， 正 是 这 个 互 斥 元 决定 了 哪个 线程 进行 pop 操作 。 一 旦 head 
改变 @， 你 就 可 以 解锁 该 互 斥 元， 在 返回 结果 的 时 候 @， 无 需 锁定 它 。 剩 下 对 tail 的 
访问 ， 需 要 锁定 尾 互 斥 元 。 因 为 只 需要 访问 tail 一 次 ， 所 以 可 以 只 在 进行 读 取 的 时 候 


获取 该 互 斥 元。 最 好 在 将 其 封装 在 函数 内 部 来 实现 。 实 际 上 ， 因 为 需要 锁定 head 互 斥 
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元 的 代码 只 是 该 成 员 的 子 集 ， 所 以 将 其 封装 在 函数 里 会 更 清晰 。 最 终 的 代码 如 清单 6.6 
所 示 。 


清单 6.6 ”使 用 细 粒 度 锁 的 线程 安全 队列 


template<typename T» 
class threadsafe queue 
private: 
struct node 
{ 
std::shared_ptr<T> data; 
std: :unique_ptr<node> next; 


}; 


std: :mutex head mutex; 

std: :unique ptr<node> head; 
std::mutex tail mutex; 
node* tail; 


node* get tail() 


( 


Std::lock guard«std::mutex» tail lock(tail mutex); 
return tail; 


std::unique ptr«node» pop head() 
std::lock_guard<std: :mutex> head_lock (head_mutex) ; 


if (head.get ()==get_tail() ) 


{ 
} 


std: :unique ptr<node> old_head=std: :move (head); 
head=std: :move (old_head->next) ; 
return old_head; 


return nullptr; 


} 


public: 
threadsafe queue(): 
head (new node) ,tail (head.get () ) 


{} 


threadsafe queue(const threadsafe queue& other) =delete; 
threadsafe queue& operator=(const threadsafe queue& other)-delete; 


std::shared ptr«T» try pop() 


{ 


std::unique_ptr<node> old head-pop head(); 
return old head?old head-»data:std::shared ptr«T»(); 


) 


void push(T new value) 


{ 
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std::shared ptr«T» new data( 
Std::make shared«T»(std::move(new value))); 
std: :unique ptr«node» p(new node); 
node* const new tail-p.get(); 
Std::lock guard«std::mutex» tail lock(tail mutex); 
tail-»data-new data; 
tail-»next-std::move (p); 
tail-new tail; 


) 


证 我 们 用 批判 的 眼光 来 分 析 这 段 代 码 ， 思 考 6.1.1 节 中 列 出 的 准则 。 在 寻找 被 破坏 
的 不 变量 前 ， 你 应 该 确定 它们 到 底 是 什么 。 

B tail->next==nullptr, 
tail->data==nullptr, 
head==tail 表明 这 是 一 个 空 链 表 。 

只 有 一 个 元 素 的 链表 必须 满足 head->next==tail。 

对 于 链表 中 的 每 一 个 结 点 Xx， 当 x!=tail 时 ，x->data 指向 了 的 一 个 实例 ， 
FA x-»next 指向 链表 中 的 下 一 个 结 点 。x->next==tail 表明 x 是 链表 中 
的 最 后 一 个 结 点 。 

E 从 head 开始 ， 沿 着 next 结 点 会 最 终 迭 代 到 tail, 

就 其 本 身 而 言 ，push () 是 直观 的 : 对 数据 结构 所 做 的 唯一 更 改 受到 tail mutex 
的 保护 ， 并 且 它 们 维持 了 不 变量 ， 因 为 新 的 尾 结 点 是 一 个 空 结 点 ， 并 且 data 和 next 
已 经 正确 设置 给 旧 的 尾 结 点 了 ， 而 旧 的 尾 结 点 成 为 了 链表 中 最 后 一 个 真正 的 结 点 。 

try pop () 这 一 部 分 很 有 趣 。 结 果 证 明了 不 仅 tail mutex 上 的 锁 对 于 保护 tail 
本 身 的 读 取 是 必要 的 ， 而 且 确保 从 头 结 点 读 取 数据 不 会 产生 数据 竞争 也 是 很 必要 的 。 如 
果 没 有 这 个 互 斥 元 ， 就 有 可 能 出 现 一 个 线程 调用 try pop O 的 同时 ， 另 一 个 线程 调用 
push), ， 而 且 它们 的 操作 并 没有 确定 的 顺序 。 尽 管 每 个 成 员 函 数 在 互 斥 元 上 都 持 有 一 
个 锁 ， 但 它们 锁定 的 是 不 同 的 互 斥 元 ， 并 且 可 能 访问 相同 的 数据 。 毕 竞 ， 队 列 中 的 所 有 
数据 都 起 源 于 对 push () 的 调用 。 因 为 线程 都 可 能 会 访问 同一 个 数据 而 没有 确定 的 顺序 ， 
就 有 可 能 导致 数据 竞争 和 未 定义 的 行为 ， 正 如 你 在 第 5 章 中 看 到 的 那样 。 幸 亏 在 
get_tail() 中 对 tail mutex 的 锁定 解决 了 一 切 问题 。 因 为 调用 get tailQ 与 调 
用 Push () 锁定 了 相同 的 互 斥 元 ， 在 这 两 次 调用 之 间 就 有 了 确定 的 顺序 。 要 么 调用 
get tail() 发 生 在 调用 push () 之 前 ， 这 种 情况 下 get_tail() 看 到 的 是 tail WIA 
值 。 要 么 调用 get tail 发 生 在 调用 Push () 之 后 ,这 种 情况 下 get tail () 看 到 的 
是 tail 的 新 值 ， 并 且 新 的 数据 附 在 了 tail 之 前 的 值 上 。 

在 锁定 head mutex 的 情况 下 调用 get tail 也 是 很 重要 的 。 如 果 不 这 么 做 ， 
对 pop head () 的 调用 可 能 会 被 阻塞 在 调用 get tail () 和 锁定 head mutex 之 间 ， 
因为 可 能 有 别 的 线程 调用 try poo () ( 接 下 来 就 是 poP_head O )， 并 且 先 获得 了 锁 ， 
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从 而 阻止 刚 开始 的 线程 继续 执行 下 去 。 


这 是 一 个 有 缺陷 的 
std: :unique ptr<node> pop_head() 实现 在 head mutex 的 锁 的 外 
{ 部 获取 旧 的 tail fi 


node* const old tail-get tail(); 
Std::lock guard«std::mutex» head lock(head mutex); 


if(head.get()--old tail) | «—6 
{ 
return nullptr; 


std::unique_ptr<node> old_head=std: :move (head) ; 
| AUR maser ò 

在 这 种 损坏 的 情况 下 ， 对 get_tail O 的 调用 @ 是 在 锁 的 范围 之 外 做 出 的 ， 你 可 
能 会 发 现在 你 的 初始 线程 能 够 获取 head mutex 上 的 锁 的 时 候 ，head 和 tail 都 已 经 
发 生 了 变化 , 并 且 不 仅 返回 的 尾 结 点 不 仅仅 不 再 是 尾部 , 甚至 都 不 再 是 链表 的 一 部 分 了 。 
这 有 可 能 意味 着 即使 head 真 的 是 最 后 一 个 结 点 ,head 和 old tail 的 比较 e 也 会 失 
败 。 因 此 ， 当 更 新 head@ 的 时 候 ， 你 可 能 将 head 移动 到 tail 之 前 ， 超 过 链表 的 结 
E, 破坏 数据 结构 。 在 清单 6.6 的 正确 实现 中 ， 始 终 保持 在 head mutex O 上 的 锁 的 范 
围 内 调用 get_tail () 。 这 就 确保 没有 别 的 线程 可 以 改变 head, FH tail 只 会 移 得 
更 远 ( 随 着 调用 push O 加 入 新 的 结 点 ) ， 因 此 是 百 分 百 安全 的 。heaqd 永远 都 不 会 越过 
get tail() 返 回 的 值 ， 因 而 保持 了 不 变量 。 

一 旦 pop_head () 通过 更 新 head， 将 结 点 从 队列 中 删除 ， 互 斥 元 就 解锁 了 ， 并 且 
try pop () 就 可 以 提取 数据 并 在 有 结 点 的 时 候 将 其 删除 (如 果 没 有 ， 就 返回 一 个 
std::shared ptr«»ff] NULL 实例 )， 按 理 说 它 就 是 能 够 访问 该 结 点 的 唯一 线程 。 

接 下 来 ， 外 部 接口 是 清单 6.2 中 的 程序 的 一 个 子 集 ， 因 此 同样 可 以 分 析 得 到 ; 接口 
中 不 存在 固有 的 竞争 条 件 。 

异常 就 更 有 趣 了 。 因 为 改变 了 数据 分 配 模式 ， 因 此 很 多 地 方 都 可 能 产生 异常 。 
try pop O 的 操作 中 只 有 锁定 互 斥 元 才能 引发 异常 ,并 且 直 到 它 获取 锁 之 后 才 会 修改 数 
ig. HE try pop O 是 异常 安全 的 。 另 一 方面 , push O 在 堆 上 分 配 一 个 了 的 实例 以 及 
一 个 新 的 结 点 实例 ， 而 这 两 者 都 可 能 会 引发 异常 。 不 管 怎样 ， 这 两 个 新 分 配 的 对 象 都 赋 
值 给 智能 指针 ， 因 此 当 引 发 异常 时 它们 就 会 被 释放 。 一 旦 获取 了 锁 ，Push () 中 的 其 他 
操作 都 不 会 引发 异常 ， 所 以 你 再 次 稳 操 胜 券 ，push () 也 是 异常 安全 的 。 

因为 没有 改变 接口 ， 所 以 没有 新 的 死 锁 的 外 部 机 会 。 同 样 也 没有 内 部 机 会 ， 只 有 在 
pop head () 中 才 会 获取 两 个 锁 ， 它 总 是 先 获 取 head mutex ， 然 后 再 获取 
tail mutex， 所 以 也 不 会 死 锁 。 

剩 下 的 问题 就 是 关于 并 发 的 实际 可 能 性 。 这 种 数据 结构 实际 上 具有 比 清单 6.2 中 数 
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据 结构 相当 多 的 并 发 范围 , 因为 这 些 锁 是 更 细 粒 度 的 , 并 且 在 锁 外 部 完成 的 更 多 。 例如 ， 
f£ push () 中 ,分 配 新 结 点 和 新 数据 项 的 是 无 需 持 有 锁 的 。 这 就 意味 着 多 个 线程 可 以 并 
发 地 分 配 新 节点 和 新 数据 项 而 不 会 出 现 问题 。 每 次 只 有 一 个 线程 可 以 在 链表 中 插 人 新 结 
点 ， 并 且 此 操作 仅仅 是 通过 一 些 简单 的 指针 赋值 来 实现 的 ， 所 以 与 所 有 内 存 分 配 操作 都 
在 std: :queue<> 内 部 的 、 基 于 std: :queue<> 的 实现 相 比 ， 它 持 有 锁 的 时 间 根 本 就 
不 算 多 。 

同样 ，tzy_Pop O 持 有 tail_mutex 的 时 间 也 很 得， 以 保护 tail 的 读 取 。 因 此 ， 
几乎 整个 对 try pop() 的 调用 可 以 与 push O 的 调用 同时 发 生 。 同 样 ， 当 持 有 
head mutex 的 时 候 所 执行 的 操作 是 很 少 的 , 昂贵 的 delete 操作 (在 结 点 指针 的 析 构 
函数 中 ) 在 锁 的 外 面 。 这 就 增加 了 同时 发 生 的 调用 try pop O 的 数量 。 一 次 只 有 一 个 
结 点 可 以 调用 pop head () ， 但 是 多 个 线程 可 以 删除 旧 结 点 并 且 安 全 地 返回 数据 。 


2 等待 一 个 数据 项 pop 


清单 6.6 提供 了 一 个 使 用 细 粒 度 锁 的 线程 安全 队列 , 但 它 只 支持 try_pop () Of B 
只 有 一 种 重 载 )。 前 面 清单 6.2 中 的 有 用 的 wait and pop O 函数 呢 ?” 能 否 用 细 粒 度 锁 
实现 相同 的 接口 呢 ? 

当然 ， 回 答 是 肯定 的 ， 但 真正 的 问题 是 ， 怎 么 做 ? 修改 push () 是 很 简单 的 ， 只 需 
要 在 函数 的 尾部 添加 data cond.notify one O 调用 即 可 ,就 如 同 在 清单 6.2 中 一 样 。 
实际 上 ， 这 并 非 那么 简单 ， 使 用 细 粒 度 锁 是 为 了 实现 并 发 量 的 最 大 化 。 如 果 在 对 
notify one () 的 调用 中 保留 互 斥 元 被 锁定 (如同 清 单 6.2)， 那么 如 果 被 通知 的 线程 在 
互 斥 元 解锁 之 前 被 唤醒 ， 它 就 得 等 待 互 斥 元 。 另 一 方面 ， 假 设 在 调用 notify one() 
之 前 就 解锁 互 斥 元 ， 那 么 当 等 待 中 的 线程 被 唤醒 时 ， 此 互 斥 元 就 可 以 被 它 使 用 (假设 没 
有 别 的 线程 先 锁定 它 )。 这 是 一 个 小 小 的 改进 ， 但 某 些 情况 下 可 能 是 很 重要 的 。 

wait and pop () 更 复杂 一 些 ， 因 为 得 决定 在 哪里 等 待 ,断言 是 什么 ， 以 及 需要 锁 
定 哪个 互 斥 元 。 你 所 等 待 的 条 件 是 “队列 非 空 ”, 它 是 用 head!=tail 表示 的 。 如 上 所 
示 ， 这 有 可 能 要 求 head mutex 和 tail mutex 都 被 锁定 ， 但 是 在 清单 6.6 中 ， 你 已 
经 决定 只 需要 在 读 取 tail 的 时 候 锁 住 tail_mutex， 比 较 本 身 是 不 需要 的 ， 因 此 可 以 
将 相同 的 逻辑 应 用 到 此 处 。 如 果 将 断言 设 定 为 head!-get _tail() ， 就 只 需要 持 有 
head _mutex， 因 此 在 调用 data cond.wait () 时 可 以 使 用 head mutex 上 的 锁 。 一 
且 增 加 了 等 待 逻辑 ， 这 种 实现 就 跟 try popO 一样 了 。 

try pop O 的 第 二 个 重 载 以 及 相对 应 的 wait and pop () 重 载 就 需要 仔细 思考 一 
下 。 如果 只 是 将 从 old head 获取 到 的 std::shared ptr<> 替 换 为 向 value BAH 
贝 赋值 , 就 可 能 存在 异常 安全 问题 。 此 刻 , 数据 项 已 经 从 队列 中 删除 , 且 互 斥 元 已 解锁 ， 
剩 下 的 就 是 向 调用 者 返回 数据 。 然 而 ， 如 果 拷 贝 赋值 引发 异常 (这 是 很 有 可 能 发 生 的 )， 
数据 项 就 会 丢失 ， 因 为 无 法 将 其 返回 到 队列 中 同样 的 位 置 。 
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如 果 模板 参数 中 使 用 的 实际 类 型 T 具有 不 引发 异常 的 移动 赋值 运算 符 , 或 是 不 引发 
异常 的 交换 操作 ,就 可 以 使 用 之 , 但 是 我 们 实际 上 更 想 要 一 个 适用 于 所 有 类 型 了 的 通用 
解决 方案 。 在 这 种 情况 下 ， 就 需要 在 结 点 从 链表 中 删除 前 ,将 可 能 的 异常 引发 移 到 锁 的 
范围 内 。 这 就 意味 着 ， 需 要 另外 的 pop_head() 重 载 ， 在 修改 链表 之 前 获取 存储 的 值 。 

相 比 之 下 ,empty O 就 很 平常 了 ,只 需要 锁定 head mutex 并 检查 head==get_tail () 
(如 清单 6.10 所 示 )。 队 列 最 终 的 代码 如 清单 6.7、 清 单 6.8、 清 单 6.9 和 清单 6.10 所 示 。 


清单 6.7 ”使 用 锁 和 等 待 的 线程 安全 队列 : 内 部 与 接口 


template<typename T» 
class threadsafe queue 
{ 
ptivate: 
struct node 
( 
Std::shared ptr«T» data; 
Std::unique ptr«node» next; 


he 


std: :mutex head mutex; 

std: :unique_ptr<node> head; 

std::mutex tail_mutex; 

node* tail; 

std::condition_variable data_cond; 
public: 

threadsafe_queue () : 

head (new node) ,tail (head.get () ) 
{} 


threadsafe queue(const threadsafe queue& other) =delete; 
threadsafe_queue& operator=(const threadsafe_queue& other) =delete; 


std::shared_ptr<T> try pop(); 

bool try pop(T& value); 
std::shared ptr«T» wait and pop(); 
void wait and pop(T& value); 

void push(T new value); 

void empty () ; 


向 队列 中 入 队 新 结 点 是 很 直观 的 一 一 其 实现 (如 清单 6.8 所 示 ) 与 之 前 展示 的 非常 
接近 。 


清单 6.8 ”使 用 锁 和 等 待 的 线程 安全 队列 : push 新 值 


template<typename T> 
void threadsafe queue«T»::push(T new value) 
{ 
std::shared_ptr<T> new_data ( 
std: :make_shared<T> (std: :move (new_value) ) ) ; 
std::unique_ptr<node> p(new node); 
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Std::lock guard«std::mutex» tail lock(tail mutex); 
tail-»data-new data; 
node* const new tail-p.get(); 
tail-»next-std::move(p); 
tail-new tail; 

) 


data cond.notify one(); 


就 像 一 直 提 到 的 那样 ， 复 杂 性 都 在 pop 端 ， 要 利用 一 系列 的 辅助 函数 来 简化 问题 。 
清单 6.9 展示 了 wait and pop () 是 如 何 实现 的 以 及 相关 的 辅助 函数 。 


清单 6.9 使 用 锁 和 等 待 的 线程 安全 队列 : wait and pop() 


template<typename T» 
class threadsafe queue 
{ 
private: 

node* get_tail() 


Std::lock guard«std::mutex» tail lock(tail mutex); 
return tail; 


Std::unique ptr«node» pop head() «9 


Std::unique ptr«node» old head-std::move (head); 
head=std: :move (old head-»next); 
return old head; 


std::unique_lock<std::mutex> wait for data() 0 


Std::unique lock«std::mutex» head lock (head_mutex) ; 
data cond.wait (head lock, [&] {return head.get() !=get_tail();}); 
return std: :move (head lock); ^e 


std::unique_ptr<node> wait pop head() 


Std::unique lock«std::mutex» head lock(wait for data()); 0 
return pop head(); 


Std::unique ptr«node» wait pop head(T& value) 


Std::unique lock«std::mutex» head lock(wait for data()); 0 
value=std: :move (*head->data) ; 
return pop head(); 
) 
public: 
std::shared ptr«T» wait and pop() 


{ 
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Std::unique ptr«node» const old head-wait pop head(); 
return old head-»data; 


) 


void wait and pop(T& value) 


{ 
} 


Std::unique ptr«node» const old head-wait pop head(value); 


be 

清单 69 所 示 的 pop 端 实现 具有 一 些 辅助 函数 来 简化 代码 和 去 重 ， 例 如 
pop head()@ 与 wait_for_data() @。 相 对 应 地 ,它们 修改 链表 以 删除 首 项 ， 并 且 
等 待 队列 中 有 数据 要 pop, wait for data 0 特别 值得 一 提 ， 因 为 它 不 仅 使 用 一 个 
lambda 函数 作为 断言 来 等 待 条 件 变量 ， 而 且 它 向 调用 者 返回 锁 的 实例 @。 这 是 为 了 确 
保 当 数据 被 相关 的 wait pop head OER O, © 修改 时 , 持 有 相同 的 锁 。 在 清单 6.10 
中 列 出 的 try_pop() 代码 中 也 复 用 了 pop_head(), 


清单 6.10 ”使 用 锁 和 等 待 的 线程 安全 队列 : try_pop() 和 empty() 


template<typename T> 
class threadsafe queue 
{ 
private: 
std: :unique_ptr<node> try pop head() 
{ 
Std::lock guard«std:;mutex» head lock (head mutex); 
if (head.get()--get tail()) 


{ 
} 


return pop head(); 


return std::unique ptr«node»(); 


std::unique_ptr<node> try pop head(T& value) 


Std::lock guard«std::mutex» head lock (head mutex); 
if (head.get () ==get_tail()) 


{ 
} 


value=std: :move (*head->data) ; 
return pop head(); 


return std::unique_ptr<node>() ; 


std::shared_ptr<T> try pop() 


std::unique ptr«node» old head-try pop head(); 
return old head?old head-»data:std::shared ptr«T»(); 


bool try pop(T& value) 
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std::unique_ptr<node> const old head-try pop head(value); 
return old head; 


) 
void empty () 


Std::lock guard«std::mutex» head lock (head mutex); 
return (head.get()--get tail()); 
E i 

这 种 队列 的 实现 将 会 作为 第 7 章 中 提 到 的 无 锁 队列 的 基础 。 这 是 一 个 无 界 队列 。 只 
要 还 有 可 用 的 内 存 ， 即 使 没有 值 被 删除 ， 线 程 也 可 以 一 直 往 队列 中 push 新 的 值 。 与 无 
界 队列 相对 的 是 有 界 队 列 ， 当 队列 被 创建 的 时 候 ， 它 的 最 大 长 度 也 已 经 定 下 来 了 。 一 且 
一 个 有 界 队 列 已 满 ， 再 试图 往 队 列 中 push 更 多 的 元 素 就 会 失败 或 者 阻塞 ， 直 到 有 元 素 
从 队列 中 pop 出 ， 以 腾 出 空间 。 有 界 队列 对 那些 基于 待 执 行 的 任务 在 线程 间 划 分 工作 ， 
要 确保 均匀 铺 开 工作 的 时 候 ， 是 很 有 用 的 (参见 第 8 章 )。 这 可 以 阻止 线程 过 快 填充 队 
列 ， 以 至 于 远 远 超过 从 队列 中 读 取 数据 的 线程 。 

这 里 展示 的 无 界 队列 的 实现 可 以 通过 在 Push () 中 等 待 条 件 变量 ， 很 容易 地 扩展 为 
限制 长 度 的 队列 。 不 同 于 等 待 队列 中 有 数据 项 〈 例 如 在 pop O 中 所 做 的 ) ， 你 需要 等 竺 
队列 中 的 项 目 数量 低 于 最 大 值 。 对 有 界 队 列 的 进一步 讨论 超出 了 本 书 的 范围 。 现 在 ， 让 
我 们 越过 队列 ， 来 看 一 看 更 复杂 的 数据 结构 。 
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栈 和 队列 是 很 简单 的 ， 它 们 的 接口 极其 有 限 ， 并 且 紧 紧 关注 特定 的 目的 。 并 非 所 有 
的 数据 结构 都 是 那么 简单 的 ， 大 部 分 数据 结构 支持 各 种 操作 。 原 则 上 ， 这 可 能 导致 更 多 
的 并 发 机 会 ， 但 因为 需要 考虑 多 种 访问 模式 ， 使 得 保护 数据 的 任务 变 得 更 加 困难 。 当 为 
并 发 访问 设计 数据 结构 时 ， 能 够 执行 的 各 种 操作 的 精确 特性 是 很 重要 的 。 

为 了 研究 所 涉及 到 的 问题 ， 我 们 先 来 看 看 查找 表 的 设计 。 


6.3.1 编写 一 个 使 用 锁 的 线程 安全 查找 表 


查找 表 或 字典 将 一 种 类 型 ( 键 类 型 ) 的 值 与 另外 一 种 相同 或 不 同类 型 (映射 类 型 ) 
的 值 联系 起 来 。 一 般 来 说 ,这 种 数据 结构 的 目的 是 使 代码 可 以 用 一 个 给 定 的 键 值 来 查询 
相关 的 数据 。 在 C++ 标准 库 中 ， 是 通过 使 用 关联 容器 来 实现 这 种 功能 的 ， 例 如 ， 
std: :map<> std: :multimap<>、std::unordered map<> 以 及 std: :unordered_ 
multimap<>, 


查找 表 的 使 用 模式 与 栈 和 队列 都 不 同 。 栈 和 队列 上 的 每 个 操作 都 会 在 一 定 程度 上 
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对 它 有 所 修改 ， 要 么 添加 一 个 元 素 要 么 删除 一 个 元 素 ， 而 查找 表 则 很 少 会 被 修改 。 清 
单 3.13 中 的 简单 DNS 缓存 就 是 这 种 情形 的 一 个 例子 ， 与 std: :map<> 相 比 ， 它 的 接 
日 极 大 地 简化 了 。 如 你 在 栈 和 队列 中 看 到 的 ， 当 从 多 个 线程 并 发 访问 数据 结构 时 ， 标 
准 容器 的 接口 并 不 合适 ， 因 为 在 接口 设计 中 存在 固有 的 竞争 条 件 ， 所 以 它们 需要 被 前 
减 并 修订 。 

从 并 发 的 角度 来 说 ，stad: :map<> 接 口 的 最 大 问题 就 是 欠 代 器 。 尽 管 当 别 的 线程 访 
i] (以 及 修改 ) 容器 时 ， 拥 有 一 个 能 够 安全 访问 容器 的 迭代 器 也 是 有 可 能 的 ， 但 这 很 再 
手 。 正 确 把 握 迭 代 器 要 求 你 去 处 理 以 下 的 问题 ， 例 如 另 一 个 线程 正在 删除 欠 代 器 引用 的 
元 素 ， 这 很 麻烦 。 作 为 线程 安全 查找 表 要 砍 掉 的 第 一 个 接口 ， 你 应 跳 过 迁 代 器 。 
std: :map<> (以 及 标准 库 中 其 他 的 关联 容器 ) 的 接口 在 很 大 程度 上 基于 迭代 器 ， 所 以 
将 它们 踢 到 一 边 并 且 重 新 开始 设计 接口 可 能 是 值得 的 。 

查找 表 只 有 一 些 的 基本 操作 。 

图 ”添加 新 的 键 / 值 对 

W ”改变 与 给 定 的 键 相 关联 的 值 。 

图。 删除 键 及 其 关联 的 值 。 

m “获得 与 给 定 键 相 关联 的 值 ， 如 果 有 的 话 。 

还 有 一 些 容器 范围 的 操作 也 是 有 用 的 , 例如 检查 容器 是 否 为 空 ， 键 的 完整 列表 的 快 
照 ， 或 是 键 / 值 对 的 完整 集合 的 快照 。 

如 果 坚 持 简单 的 线程 安全 准则 ， 例 如 不 返回 引用 ， 以 及 在 每 个 成 员 函 数 上 都 有 
一 个 互 斥 元 ， 那 么 这 些 操作 都 是 安全 的 。 它 们 要 么 出 现在 其 他 线程 的 某 个 修改 之 前 ， 
要 么 在 之 后 。 最 有 可 能 产生 竞争 条 件 的 ， 是 在 添加 一 个 新 的 键 / 值 对 的 时 候 。 如 采 两 
个 线程 添加 一 个 新 值 ， 只 有 一 个 线程 会 胜出 ， 第 二 个 会 因此 而 失败 。 一 种 可 能 的 方 
法 将 添加 和 改变 操作 整合 进 单个 成 员 函 数 中 , 就 像 你 为 清单 3.13 中 的 DNS 缓存 所 做 
的 那样 。 

从 接口 的 角度 来 看 ， 有 趣 一 点 是 获取 相关 联 值 时 的 “如 果 有 ”的 部 分 。 一 种 选择 是 
当 键 不 存在 的 情况 下 ， 人 允许 用 户 提供 一 个 “默认 的 ”结果 来 返回 。 


mapped type get value(key type const& key, mapped type default value); 


在 这 种 情况 下 ， 如 果 没 有 显 式 提 供 default_value, 可 以 使 用 mapped type 
的 默认 构造 函数 实例 。 这 也 可 以 扩展 为 返回 一 个 std: :pair<mapped_ 
type,boo1l> 类 型 的 实例 , 而 不 只 是 mapped type 的 实例 , 这 里 的 bool 指示 值 是 
否 存 在 。 另 一 种 选择 就 是 ， 返 回 一 个 引用 该 值 的 智能 指针 。 如 果 指 针 的 值 为 NULL， 
就 是 没有 返回 值 。 

如 上 所 述 ,一 旦 决定 了 接口 ， 那 么 (假设 没有 接口 竞争 条 件 ) 可 以 通过 在 每 个 成 员 
函数 中 使 用 一 个 互 斥 元 和 一 个 简单 锁 来 保护 下 层 的 数据 结构 ， 以 保证 线程 安全 。 然 而 ， 
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这 会 浪费 通过 独立 的 函数 来 读 取 数据 结构 并 修改 它 所 提供 的 并 发 可 能 性 。 一 种 方法 是 使 

一 个 支持 多 个 读 线程 或 者 一 个 写 线 程 的 互 斥 元 ， 例 如 清单 3.13 中 使 用 的 
boost::shared mutex。 尽管 这 种 方法 可 以 提高 并 发 访问 的 可 能 性 , 但 是 每 次 只 有 一 
个 线程 能 够 修改 数据 结构 。 理 想 情况 下 ， 你 会 想 要 做 得 更 好 一 些 。 


设计 一 个 细 粒 度 锁 的 MAP 数据 结构 


如 同 在 6.2.3 中 提 到 的 队列 一 样 ， 为 了 允许 细 粒 度 锁 ， 你 需要 仔细 考虑 数据 结构 的 
细节 ， 而 不 是 仅仅 封装 一 个 类 似 于 std: :map<> 这 样 已 存在 容器 。 这 里 通常 有 三 种 常见 
的 方法 来 实现 一 个 类 似 于 查找 表 的 关联 容器 。 

WB 二 又 树 ， 例 如 红 黑 树 。 

m 已 排序 数组 。 

W AFR. 

二 叉 树 不 能 为 扩大 并 发 机 会 提供 太 多 的 空间 , 每 次 查找 或 修改 必须 从 访问 根 节点 开 
始 ， 因 此 根 节点 必须 被 锁定 。 尽 管 当 线 程 沿 着 树 往 下 移动 的 时 候 会 释放 这 个 锁 ， 但 是 这 
也 不 比 锁定 整个 数据 结构 好 多 少 。 

已 排序 数组 就 更 糟 了 ， 因 为 无 法 事先 得 知 一 个 给 定 的 数据 在 数组 的 哪个 位 置 ， 所 以 
就 需要 一 次 锁定 整个 数组 。 

只 剩 下 哈 希 表 了 。 假 设 有 一 定数 量 的 桶 ， 一 个 键 属于 哪个 桶 完全 取决 于 这 个 键 及 其 
哈 硕 函数 的 特性 。 这 就 意味 着 可 以 安全 地 在 每 个 桶 上 有 一 个 独立 的 锁 。 如 果 再 次 使 用 支 
持 多 重读 或 单一 写 的 互 斥 元 ， 你 就 将 并 发 机 会 增加 了 N 重 ， 这 里 的 N 是 桶 的 数量 。 其 
缺点 是 为 键 找 一 个 好 的 哈 希 函数 。C++ 标 准 库 提供 了 std: :hash<> 模 板 ， 可 以 用 来 实 
现 这 一 目的 。 它 已 经 为 int 等 基本 类 型 以 及 std::string 这 样 的 常见 库 类 型 进行 了 
特 化 , 而 且 使 用 者 也 可 以 轻易 地 为 别 的 键 类 型 将 其 进行 特 化 。 如 果 效 仿 标 准 的 无 序 容器 ， 
以 及 在 进行 哈 希 计算 时 将 函数 对 象 类 型 作为 模板 参数 ， 那么 使 用 者 可 以 选择 是 否 为 键 类 
型 特 化 std: :hash<>， 或 是 提供 一 个 单独 的 哈 希 函数 。 

那么 ， 让 我 们 来 看 清单 611 中 的 代码 。 一 个 线程 安全 查找 表 的 实现 将 会 是 怎样 的 
呢 ? 这 里 列 出 了 一 种 可 能 的 实现 。 


清单 6.11 ”线程 安全 查找 表 


template«typename Key,typename Value,typename Hash-std::hash«Key» > 
class threadsafe lookup table 


private: 
class bucket type 


private: 
typedef std::pair«Key,Value» bucket value; 


hn 


6.3 设计 更 复杂 的 基于 锁 的 数据 结构 


typedef std::list«bucket value» bucket data; 
typedef typename bucket data::iterator bucket iterator; 


bucket data data; 
mutable boost::shared mutex mutex; +@ 


bucket iterator find entry for(Key const& key) const +O 


{ 


} 


public: 


return std::find if(data.begin(),data.end(), 
[&] (bucket value const& item) 
{return item.first==key; }) ; 


Value value_for(Key const& key,Value const& default_value) const 


{ 


} 


boost: :shared_lock<boost::shared_mutex> lock (mutex) ; +9 
bucket_iterator const found_entry=find_entry_for (key) ; 
return (found_entry==data.end())? 

default_value: found_entry->second; 


void add or update mapping(Key const& key,Value const& value) 


{ 


} 


std: :unique_lock<boost::shared_mutex> lock (mutex) ; +O 
bucket_iterator const found_entry=find_entry_for(key) ; 
if (found_entry==data.end() 


{ 
data.push_back (bucket value (key, value) ) ; 
} 
else 
{ 
found entry-»second-value; 
) 


void remove mapping(Key const& key) 


{ 


std: :unique lock«boost::shared mutex> lock (mutex); 0 
bucket_iterator const found_entry=find_entry_for (key) ; 
if (found_entry!=data.end()) 


{ 
} 


data.erase(found entry); 


Std::vector«std::unique ptr«bucket type» > buckets; 0 
Hash hasher; 


bucket_type& get_bucket (Key const& key) const 0 


{ 


) 


public: 


Std::size t const bucket index-hasher (key) *buckets.size() ; 
return *buckets [bucket index]; 


typedef Key key type; 
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typedef Value mapped type; 

typedef Hash hash type; 

threadsafe lookup table( 
unsigned num buckets-19,Hash const& hasher -Hash()): 
buckets (num_buckets) , hasher (hasher_) 


{ 


for(unsigned i=0;i<num_buckets; ++i) 


buckets [i] .reset (new bucket type); 
} 
} 


threadsafe lookup table(threadsafe lookup table const& other) =delete; 
threadsafe lookup table& operator-( 
threadsafe lookup table const& other)-delete; 


Value value for(Key const& key, 
Value const& default value-Value()) const 
{ 


} 


void add or update mapping(Key const& key, Value const& value) 


{ 
} 


void remove_mapping(Key const& key) 


{ 
} 


return get bucket (key) .value_for (key, default_value) ; 0 


get bucket (key) .add or update mapping (key, value) ; -© 


get_bucket (key) .remove mapping (key); +O 
Js 

该 实现 使 用 std: :vector<std: :unique ptr«bucket type>>@ 来 持 有 桶 ， 
允许 在 构造 函数 中 指定 桶 的 数量 。 默 认 值 是 19, 这 是 一 个 任意 选择 的 质数 。 哈 希 表 与 质 
数 数量 的 桶 合作 得 最 好 。 每 个 桶 都 被 一 个 boost : :shared mutex 的 实例 保护 O, 使 
得 每 个 桶 都 可 以 允许 很 多 个 并 发 读 或 者 单个 调用 其 中 一 个 修改 函数 。 

因为 桶 的 数量 是 固定 的 ， 所 以 在 调用 get bucket () 函数 @ 时 无 需 锁定 @、@、@, 而 
且 桶 互 斥 元 随后 可 以 被 锁定 为 共享 (只 读 ) MAIO, REME QE) 所 有 权 @、@， 对 
每 个 函数 都 是 适用 的 。 

这 三 个 函数 都 使 用 桶 上 的 find entry for () 成员 函数 @ 来 确定 在 桶 上 是 否 有 人 
口 。 每 个 桶 包含 一 个 键 / 值 对 的 std: :1ist<>， 因 此 添加 和 删除 项 目 是 很 简单 的 。 

我 还 关注 了 并 发 的 角度 ， 所 有 的 东西 都 被 互 斥 元 锁 合 适 地 保护 着 ， 那 么 异常 安全 
呢 ? value for 并 不 修改 任何 东西 ， 所 以 没关系 ， 如 果 它 引发 异常 ， 也 不 会 影响 数据 
结构 。remove_mapping 调用 erase 的 时 候 会 修改 列表 , 但 是 保证 不 会 引发 异常 ， 因 
此 是 安全 的 。 只 有 add or update mapping 在 if 的 两 个 分 支 上 可 能 会 引发 异常 。 
push back 是 异常 安全 的 ， 当 它 引 发 异常 时 ， 会 将 列表 留 在 原始 状态 ， 因 此 这 个 分 支 
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是 没 问题 的 。 在 这 种 情况 下 ， 唯 一 的 问题 就 是 当 蔡 换 一 个 现存 值 时 所 做 的 赋值 ， 如 有 果 此 
赋值 引发 异常 ,那么 就 得 指望 它 不 要 修改 原始 值 。 然而, 这 在 整体 上 并 不 影响 数据 结构 ， 
而 且 完 全 是 用 户 提供 类 型 的 属性 ， 因 此 可 以 安全 地 把 它 留 给 用 户 来 处 理 。 

在 本 节 的 开头 , 我 提 到 这 种 查找 表 的 一 个 不 错 的 功能 ， 就 是 可 以 获取 到 当前 状态 的 
快照 的 选项 ,比如 std: :map<>。 为 了 确保 能 够 得 到 该 状态 的 一 致 的 副本 , 就 需要 锁定 
整个 容器 ， 也 就 是 需要 锁定 所 有 的 桶 。 因 为 查找 表 中 “普通 的 ”操作 一 次 只 需要 锁定 一 
个 桶 ， 这 就 会 是 唯一 一 个 需要 锁定 所 有 桶 的 操作 。 因 此 ， 只 要 每 次 按照 相同 的 顺序 A 
如 ， 递 增 桶 的 索引 ) 来 锁定 桶 ， 就 不 会 有 死 锁 的 机 会 。 清 单 6.12 给 出 了 一 个 实现 。 


清单 6.12 ”获取 threadsafe lookup table 的 内 容 作为 一 个 std::map<> 


std: :map«Key, Value» threadsafe lookup table::get map() const 
{ 
std: :vector<std::unique_lock<boost::shared_mutex> > locks; 
for (unsigned i=0;i<buckets.size() ;++i) 
{ 
locks .push_back ( 
std: :unique_lock<boost: : shared_mutex> (buckets [i] .mutex) ) ; 
} 
std: :map<Key,Value> res; 
for (unsigned i=0;i<buckets.size() ;++i) 
{ 
for (bucket_iterator it=buckets[i] .data.begin() ; 
it!=buckets [i] .data.end() ; 
++it) 
{ 
res.insert (*it) ; 
} 
} 
return res; 


} 

清单 6.11 中 查找 表 实现 通过 单独 锁定 每 个 桶 以 及 使 用 一 个 boost: : shared mutex 
实例 来 允许 基于 每 个 桶 的 并 发 读 取 ， 这 就 从 总 体 上 增加 了 查找 表 的 并 发 机 会 。 但 是 如 果 要 
通过 更 细 粒 度 的 锁 来 增加 并 发 的 潜力 呢 ? 在 下 一 节 ， 将 通过 使 用 具有 和 迭代 器 支持 的 线程 安 
全 链表 容器 来 实现 。 


6.3.2 ”编写 一 个 使 用 锁 的 线程 安全 链表 


链表 是 一 种 最 基本 的 数据 结构 ， 因 此 它 应 该 能 被 直接 写成 线程 安全 的 ， 不 是 吗 ? 那 
么 , 这 取决 于 你 追求 什么 样 的 功能 ， 并 且 需 要 提供 迭代 髓 支持 ,这 是 我 一 直 避 免 将 其 加 
入 到 你 的 基础 图 中 的 东西 ， 因 为 它 太 复杂 了 。STL 风格 的 迭代 器 支持 ， 指 的 是 兴 代 器 必 
须 持 有 某 种 对 容器 内 部 数据 结构 的 引用 。 如 果 容 器 可 以 被 另 一 个 线程 修改 ， 这 个 引用 必 
须 仍然 有 效 , 这 就 从 根本 上 要 求 迭 代 器 在 部 分 数据 结构 上 持 有 锁 。 考虑 到 STL USERS 
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代 器 的 生存 期 是 完全 不 受 容 器 控制 的 ， 这 就 不 是 个 好 主意 。 

另 一 种 方式 是 提供 类 似 于 foreach 这 样 的 迭代 函数 作为 容器 本 身 的 一 部 分 。 这 就 
让 容器 完全 负责 迭代 器 和 锁 ， 但 是 这 与 第 3 章 中 提 到 的 避免 死 锁 原则 是 冲突 的 。 为 了 使 
得 for each 做 一 些 有 用 的 操作 ， 它 就 必须 在 持 有 内 部 锁 的 时 候 调 用 用 户 提 供 的 代码 。 
不 仅 如 此 ， 为 了 使 用 户 提 供 的 代码 能 够 作用 于 数据 项 ， 它 必须 将 对 每 个 数据 项 的 引用 传 
递 给 用 户 提供 的 代码 。 你 可 以 通过 向 用 户 提供 的 代码 传递 每 个 数据 项 的 副本 来 避免 这 一 
点 ， 但 是 当 数 据 项 很 大 时 ， 这 种 方式 就 很 耗费 资源 。 

因此 ， 目 前 我 们 把 它 留 给 用 户 ， 让 他 们 确保 不 会 在 用 户 提供 的 操作 中 因 获 取 锁 而 导 
致死 锁 ， 并 且 通 过 在 锁 外 的 访问 中 存储 引用 以 避免 导致 数据 竞争 。 就 查找 表 所 使 用 的 链 
表 来 说 ， 它 是 完全 安全 的 ， 因 为 不 会 做 任何 不 恰当 的 操作 。 

留 给 你 的 问题 是 ， 要 为 链表 提供 哪些 操作 。 如 果 回 顾 一 下 清单 6.11 以 及 6.12, 就 可 
以 知道 需要 下 列 操作 。 

图 ”向 链表 添加 新 项 目 。 

图 ”从 链表 中 删除 满足 一 定 条 件 的 项 目 。 

W ”在 链表 中 查找 满足 一 定 条 件 的 项 目 。 

B 更 新 满足 一 定 条 件 的 项 目 。 

W 复制 链表 中 每 个 项 目 到 另 一 个 容器 中 。 

为 了 令 其 成 为 良好 的 通用 链表 容器 , 添加 进一步 的 操作 例如 在 指定 位 置 插入 是 很 有 
用 的 ， 但 是 对 于 查找 表 是 不 需要 的 ， 因 此 我 将 它 留 给 读者 作为 练习 。 

在 链表 中 使 用 细 粒 度 锁 的 基本 思想 是 每 个 结 点 使 用 一 个 互 斥 元 。 如 果 链 表 很 大 ， 就 
会 有 很 多 互 斥 元 ! 其 好 处 就 是 在 链表 不 同 部 分 的 操作 是 真正 并 发 的 。 每 个 操作 仅 在 其 真 
正 关注 的 结 点 上 持 有 锁 ， 并 且 当 它 移 动 到 下 一 个 结 点 时 ， 会 解锁 每 个 结 点 。 清 单 6.13 
给 出 了 正 是 这 样 一 个 链表 的 实现 。 


清单 6.13 ”支持 迭代 的 线程 安全 链表 


template<typename T> 
class threadsafe list 


{ 
struct node 0 
( 
Std::mutex m; 
std::shared_ptr<T> data; 
Std::unique ptr«node» next; 


node () : <0 


next () 


} bus 
node(T const& value) : 


data (std: :make_shared<T> (value) ) 
{} 


n 
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node head; 


public: 


threadsafe list () 


{} 


~threadsafe_list () 


{ 
} 


remove if([] (node const&) {return true;]); 


threadsafe list(threadsafe list const& other) =delete; 
threadsafe list& operator=(threadsafe_list const& other) =delete; 


void push front(T const& value) 


{ 


} 


std::unique_ptr<node> new node (new node (value) ) ; 0 
Std::lock guard«std::mutex» lk (head.m) ; 
new_node->next=std: :move (head.next) ; 0 
head.next=std: :move (new_node) ; pp 


template<typename Function> 
void for_each (Function f) +@ 


{ 


} 


node* current-&head; 
std: :unique_lock<std: :mutex> 1k (head.m) ; -© 
while(node* const next=current->next.get () ) 0 


{ 


std::unique lock«std::mutex» next 1k (next-»m); +O 


lk.unlock(); 

f(*next-»data); «p O 
current=next; 

lk=std: :move (next_1k) ; <Ð 


template<typename Predicate> 
std::shared ptr«T» find first if(Predicate p) +Q 


{ 


node* current-&head; 
std: :unique lock«std::mutex» lk(head.m); 
while(node* const next=current->next .get () ) 


{ 


std::unique_lock<std::mutex> next lk(next-»m); 


lk.unlock(); 
if (p(*next-»data)) -+ 
{ 
return next->data; < 


) 


current-next; 
lksstd::move(next lk); 


) 


return std::shared ptr«T»(); 
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template<typename Predicate> 
void remove if (Predicate p) +Q 


node* current=&head; 
std: :unique_lock<std::mutex> 1k(head.m) ; 
while (node* const next=current->next.get () ) 
{ 
std: :unique_lock<std: :mutex> next lk(next-»m); 
if (p (*next->data) ) 
{ 
Std::unique ptr«node» old_next=std: :move(current->next) ; 
current ->next=std: :move (next->next) ; 
next lk.unlock(); 


) 


else 


{ 
1k.unlock () ; A) 


current=next; 
lk=std: :move (next_1k) ; 
} 
} 
} 


清单 6.13 中 的 threadsafe 1ist<> 是 一 个 单 链表 ， 每 个 人 口 是 一 个 node 结构 
体 @。 默 认 构造 的 node 是 链表 的 head， 开 始 时 它 的 next 指针 为 NULL@。 新 结 点 是 
通过 Push_front () 函数 增加 的 ， 首 先 构 造 一 个 新 结 点 ©, 在 堆 上 分 配 存 储 的 数据 ©, 
保留 next 指针 为 NULL。 然 后 你 需要 为 head 结 点 获取 互 斥 元 上 的 锁 来 得 到 正确 的 
next 值 @， 并 且 通 过 将 head. next 设置 为 指向 新 结 点 来 实现 将 这 个 结 点 插入 链表 前 
方 @。 到 目前 为 止 , 一 切 都 还 不 错 ， 你 只 需要 锁 住 一 个 互 斥 元 来 将 新 项 目 插入 链表 ， 因 
此 没有 死 锁 的 风险 。 同 样 ， 缓慢 的 内 存 分 配 发 生 在 锁 之 外 ， 因 此 锁 只 保护 几 个 指针 值 的 
更 新 并 且 不 会 失败 。 下 面 是 欠 代 函数 。 

首先 ， 我 们 来 看 看 for each () @。 这 个 操作 用 接受 某 种 类 型 的 Function， 作 用 
于 表 中 的 每 一 个 元 素 ， 通常 在 大 多 数 标 准 库 中 ， 它 会 通过 值 形式 接受 此 函数 ， 并 且 可 以 
与 真正 的 函数 或 者 是 具有 函数 调用 操作 符 的 某 种 类 型 的 对 象 一 起 运作 。 在 这 种 情况 下 ， 
函数 必须 接受 类 型 为 了 的 值 作为 唯一 的 参数 。 这 就 是 你 进行 交替 锁定 的 地 方 。 刚 开始 ， 
你 锁定 head 结 点 上 的 互 斥 元 @。 然 后 就 可 以 安全 地 获得 指向 next 结 点 的 指针 (使 用 
get () 因为 你 并 不 打算 获取 该 指针 的 所 有 权 )。 如 果 该 指针 不 为 NULL@ ， 就 锁定 那个 结 
点 上 的 互 斥 元 @ 来 处 理 数据 。 一 旦 你 锁定 那个 结 点 ， 就 可 以 释放 之 前 结 点 的 锁 @@， 并 且 
调用 指定 的 函数 @。 一旦 函数 完成 ,就 可 以 更 新 current 指针 指向 你 刚刚 处 理 的 结 点 ， 
并 且 将 锁 的 拥有 权 从 next lk 移动 (move) 到 1k®, AW for_each 将 每 个 数据 项 
直接 传递 给 所 提供 的 Function， 如果 需 要 的 话 , 你 可 以 使 用 它 更 新 数据 项 或 者 将 它们 
复制 到 另 一 个 容器 中 ， 或 其 他 任何 事情 。 如 果 函 数 表 现 良好 这 就 是 安全 的 ， 因 为 拥有 数 
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据 项 的 结 点 在 整个 调用 中 都 持 有 互 斥 元 。 

find first if()D5 for each () 是 类 似 的 ， 最 主要 的 不 同 之 处 在 于 提供 的 
Predicate 必须 返回 true 来 表明 找到 了 匹配 项 或 者 false RRM RRF| LAMBS. 
一 旦 你 找到 匹配 项 ， 你 就 返回 找到 的 数据 @ 而 不 是 继续 查找 。 你 可 以 用 for each () 来 
实现 它 ， 但 是 一 旦 找到 匹配 项 就 不 需要 继续 处 理 链表 中 剩 下 的 部 分 了 。 

remove if ()@ 有 些 不 同 , 因为 这 个 函数 必须 真正 地 更 新 链表 , 你 不 能 用 for each () 
来 实现 它 。 如 果 Predicate 返回 true@， 你 就 通过 更 新 cuzrent->next 国 将 这 个 结 点 
从 链表 中 删除 。 一 旦 完成 ， 就 可 以 释放 next 结 点 互 斥 元 所 持 有 的 锁 。 当 你 将 它 移 人 的 
std::unique ptr<node> 超 出 范围 时 ， 该 结 点 就 被 删除 了 轩 。 在 这 种 情况 下 ， 你 不 用 更 
新 current ， 因 为 需要 检查 新 的 next 结 点 。 如 果 Predicate 返回 false, 你 就 像 以 前 
一 样 处 理 团 。 

那么 , 这 些 互 斥 元 上 存在 着 死 锁 或 者 竞争 条 件 么 ? 答案 毫 无 疑问 是 否定 的 ， 前 提 是 
所 提供 的 断言 和 函数 是 表现 良好 的 。 和 迭代 总 是 按照 同一 方式 ， 通 常 从 head 结 点 开始 ， 
并 且 总 是 在 释放 当前 互 斥 元 前 就 锁 住 下 一 个 互 斥 元 , 因此 不 可 能 在 不 同 的 线程 间 有 不 同 
的 锁 顺 序 。 唯 一 可 能 产生 竞争 条 件 的 ， 就 是 在 remove_if () 中 对 待 删除 结 点 的 删除 ， 
因为 你 会 在 解锁 互 斥 元 之 后 才 这 人 么 做 (销毁 一 个 锁定 的 互 斥 元 是 未 定义 的 行为 )。 然 而 ， 
稍 加 思考 就 会 知道 这 确实 是 安全 的 , 因为 你 仍然 持 有 之 前 结 点 (current) 上 的 互 斥 元 ， 
因此 没有 新 线程 可 以 试图 获取 你 要 删除 的 结 点 上 的 锁 。 

并 发 的 机 会 又 如 何 呢 ? 这 种 细 粒 度 锁 的 关键 是 在 单个 互 斥 元 上 提高 并 发 的 可 能 性 ， 
那么 实现 这 一 点 了 么 ?是 的 , 已 经 实现 了 。 不 同 的 线程 可 以 同时 在 链表 的 不 同 结 点 上 工 
WE, 无 论 它们 正在 用 for_each () 处 理 每 个 数据 项 , 还 用 find first if ORR, 还 
是 用 remove if () 来 删除 项 目 @@。 但 是 因为 每 个 结 点 的 互 斥 元 轮流 被 锁定 ， 线 程 不 能 
互相 超越 。 如 果 一 个 线程 花 了 很 长 时 间 处 理 一 个 特定 的 结 点 ， 当 别 的 线程 到 达 此 特定 结 
点 时 就 必须 等 待 。 


小 结 


本 章 开头 考虑 了 为 并 发 设计 一 个 数据 结构 意味 着 什么 ， 并 且 提 供 了 一 些 准 则 来 实 
现 。 然 后 我 们 完成 一 些 通用 的 数据 结构 ( 栈 、 队 列 、 哈 希 映射 以 及 链表 )， 考 虑 了 如 何 
在 设计 并 发 存 取 的 时 候 应 用 这 些 准 则 来 实现 它们 ， 使 用 锁 来 保护 数据 并 阻止 数据 竞争 。 
现在 你 可 以 考虑 设计 你 自己 的 数据 结构 , 观察 哪里 有 并 发 的 机 会 以 及 哪里 可 能 会 存在 竞 
争 条 件 。 

在 第 7 章 ， 我 们 将 看 一 看 完全 避免 锁 的 方法 ， 使 用 底层 原子 操作 来 提供 必要 的 顺序 
限制 ， 并 且 遵 循 同 样 的 准则 。 


第 7 章 ”设计 无 锁 的 并 发 数据 颖 构 


上 一 章 中 ,我 们 分 析 了 为 实现 并 发 性 设计 数据 结构 时 需要 考虑 的 一 般 方面 ， 考 虑 了 
这 种 设计 确保 安全 的 准则 。 然 后 ， 我 们 验证 了 几 种 常见 的 数据 结构 ， 并 且 分 析 了 使 用 互 
斥 元 和 锁 来 保护 共享 数据 的 实现 的 例子 。 在 前 面 的 几 个 例子 中 ,使 用 一 个 互 斥 元 来 保护 
整个 数据 结构 。 在 后 面 的 几 个 例子 中 ， 使 用 多 个 互 斥 元 来 保护 数据 结构 的 多 个 小 部 分 ， 
并 且 在 访问 数据 结构 时 允许 了 更 大 级 别 的 并 发 。 

互 斥 元 是 保证 多 个 线程 可 以 安全 访问 数据 结构 ， 而 不 会 遇 到 竞争 条 件 和 破坏 不 变量 
的 有 效 机 制 。 在 探讨 使 用 它们 的 代码 的 行为 时 也 相对 较 简单 ， 代 码 要 么 让 保护 数据 的 互 
斥 元 锁定 ， 要 么 就 不 这 样 。 然 而 ， 这 也 并 不 全 然 那么 好 。 第 3 章 中 ， 看 到 了 锁 的 不 当 使 
用 会 如 何 导 致死 锁 ， 并 且 在 基于 锁 的 队列 和 查找 表 的 例子 中 ， 可 以 看 出 锁 的 粒度 是 如 何 
影响 真正 并 发 的 潜能 。 如 果 能 设计 出 不 使 用 锁 就 能 实现 安全 并 发 存 取 的 数据 机 构 ， 就 有 
可 能 避免 这 些 问 题 。 这 种 数据 结构 被 称 为 无 锁 数 据 结构 。 

在 本 章 中 , 我 们 将 考虑 如 何 将 第 5 章 中 提 到 的 原子 操作 的 内 存 顺 序 特性 应 用 到 无 锁 
数据 结构 的 构造 中 。 设 计 这 种 数据 结构 时 需要 特别 小 心 ， 因 为 很 难 做 得 正确 ， 并 且 导致 
设计 失败 的 条 件 可 能 很 少 发 生 。 首 先 ， 我 们 来 了 解数 据 结构 无 锁 的 含义 。 然 后 ， 在 分 析 


7.1 定义 和 结果 


一 些 实例 之 前 ， 我 们 会 介绍 使 用 它们 的 原因 ， 并 得 出 一 些 通用 准则 。 


11 定义 和 结果 


使 用 互 斥 元 、 条 件 变量 以 及 future 来 同步 数据 的 算法 和 数据 结构 被 称 为 阻塞 
(blocking) 的 算法 和 数据 结构 。 调 用 库 函 数 的 应 用 会 中 断 一 个 线程 的 执行 ， 直 到 另 一 个 
线程 执行 一 个 动作 。 这 种 库 函 数 调用 被 称 为 阻塞 调用 ， 因 为 直到 阻塞 被 释放 时 线程 才能 
继续 执行 下 去 。 通 常 ， 操 作 系统 会 完全 阻塞 一 个 线程 〈 并 且 将 这 个 线程 的 时 间 片 分 配给 
另 一 个 线程 ) 直到 另 一 个 线程 执行 了 适当 的 动作 将 其 解锁 ， 可 以 是 解锁 互 斥 元 、 通 知 条 
件 变 量 或 者 使 得 future 就 绪 。 

。 不 使 用 阻塞 库 函 数 的 数据 结构 和 算法 被 称 为 非 阻塞 (nonblocking) 的 。 但 是 ， 并 不 
是 所 有 这 样 的 数据 结构 都 是 无 锁 Clock-free) 的 ， 因 此 我 们 来 看 一 看 非 阻塞 数据 结构 的 
各 种 类 型 。 


7.1.1 非 阻塞 数据 结构 的 类 型 


第 5 章 中 ， 我 们 实现 了 一 种 使 用 std::atomic flag 作为 自 旋 锁 的 基本 互 斥 元 。 
清单 7.1 中 复 刻 了 该 代码 。 


清单 7.1 使 用 std::atomic flag 的 自 旋 锁 互 斥 元 的 实现 


class spinlock mutex 


Std::atomic flag flag; 
public: 
spinlock mutex(): 
flag(ATOMIC FLAG INIT) 
{} 


void lock () 
{ 


while(flag.test and set(std::memory order acquire)); 


void unlock() 


{ 
} 


flag.clear(std::memory order release); 


Ji 

这 段 代码 不 调用 任何 阻塞 函数 , Lock () 一 直 循 环 直 到 对 test_and_set () 的 
调用 返回 false。 这 就 是 自 旋 锁 (spin lock) 名 称 的 由 来 一 一 代码 围绕 着 循环 “ 旋 
转 ”。 无 论 如 何 ， 这 里 没有 阻塞 调用 ， 因 此 任何 使 用 此 互 斥 元 来 保护 共享 数据 的 代 
码 因 而 都 是 非 阻塞 的 。 然 而 ， 它 并 非 无 锁 的 。 它 仍然 是 一 个 互 斥 元 ， 并 且 一 次 仍然 
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只 能 被 一 个 线程 锁定 。 我们 来 看 看 无 锁 的 定义 ,这样 就 能 明白 哪些 类 型 的 数据 结构 
是 被 涉及 的 。 


7.1.2 无 锁 数据 结构 


对 于 有 资格 称 为 无 锁 的 数据 结构 , 就 必须 能 够 让 多 于 一 个 线程 可 以 并 发 地 访问 此 数 
据 结 构 。 这 些 线程 不 需要 做 相同 的 操作 ， 无 锁 队 列 可 以 允许 一 个 线程 push. 的 同时 另 一 
个 线程 pop， 但 是 如 果 两 个 线程 同时 试图 插 push 新 数据 项 的 时 候 ， 就 会 打破 无 锁 队 列 。 
不 仅 如 此 ,如 果 一 个 访问 数据 结构 的 线程 在 操作 中 途 被 调度 器 挂 起 的 话 ， 别 的 线程 必须 
仍然 能 够 完成 操作 而 无 需 等 待 挂 起 的 线程 。 

在 数据 结构 上 使 用 比较 /交换 操作 的 算法 经 常 在 其 中 包含 循环 。 使 用 比较 /交换 操 
作 是 因为 有 可 能 另 一 个 线程 正在 同时 修改 数据 ， 这 种 情况 下 ， 代 码 就 需要 在 试图 重 
新 比较 /交换 前 重 做 部 分 操作 。 如 果 比 较 /交换 操作 最 终 在 其 他 线程 都 被 中 断 的 情况 下 
成 功 ， 那 么 这 种 代码 仍然 是 无 锁 的 。 如 果 没 有 ， 最 起 码 要 使 用 自 旋 锁 ， 是 非 阻塞 的 
而 不 是 无 锁 的 。 

具有 这 种 循环 的 无 锁 算法 可 能 会 导致 一 个 线程 承受 饥饿 。 如 果 另 一 个 线程 在 “错误 
的 ”时 间 执 行 操作 ， 那 么 当 第 一 个 线程 持续 重 试 其 操作 时 ， 别 的 线程 则 可 以 继续 前 进 。 
能 够 避免 此 类 问题 的 数据 结构 是 无 等 待 ， 也 是 无 锁 的 。 


7.1.3 无 等 待 的 数据 结构 


无 等 待 的 数据 结构 是 一 种 无 锁 的 数据 结构 ， 并 且 有 着 额外 的 特性 ， 每 个 访问 数据 结 
构 的 线程 都 可 以 在 有 限 数量 的 步 又 内 完成 它 的 操作 ， 而 不 用 管 别 的 线程 的 行为 。 因 为 其 
他 线程 的 冲突 而 可 能 卷 人 无 限 次 重 试 的 算法 不 是 无 等 待 的 。 

正确 地 编写 无 等 待 的 数据 结构 是 极其 困难 的 。 为 了 确保 每 个 线程 都 能 够 在 有 限 步 
院内 完成 它 的 操作 ， 就 必须 保证 每 个 操作 都 可 以 在 一 个 操作 周期 内 执行 ， 并 且 一 个 线 
程 执行 的 操作 不 会 导致 另 一 个 线程 上 操作 的 失败 。 这 会 使 得 各 种 操作 的 整体 算法 变 得 
相当 复杂 。 

鉴于 正确 地 设计 无 锁 或 无 等 待 数据 结构 是 如 此 困难 ,你 需要 一 些 很 好 的 理由 来 支撑 
这 一 点 ， 你 需要 确信 收益 胜 于 代价 。 所 以 ， 让 我 们 来 检验 影响 此 平衡 的 重点 。 


7.1.4 无 锁 数据 结构 的 优点 与 缺点 


到 了 这 一 步 , 使 用 无 锁 数据 结构 的 最 主要 的 原因 就 是 为 了 实现 最 大 程度 的 并 发 。 对 
于 基于 锁 的 容器 ， 总 是 有 可 能 一 个 线程 必须 阻塞 ， 并 在 可 以 继续 前 等 待 男 一 个 线程 完成 
其 操作 。 互 斥 元 锁 的 目的 就 是 通过 互 斥 来 阻止 并 发 。 使 用 无 锁 数据 结构 时 ， 某 些 线程 一 
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步 步 地 执行 操作 。 使 用 无 等 待 数据 结构 时 ， 不 管 别 的 线程 在 做 什么 操作 ， 每 个 线程 都 可 
以 继续 执行 而 不 需要 等 待 。 这 是 一 种 很 希望 得 到 但 是 却 很 难得 到 的 特性 。 都 很 容易 在 编 
写 基本 的 一 个 自 旋 锁 时 告终 。 

使 用 无 锁 数 据 结构 的 第 二 个 原因 是 健壮 性 。 当 一 个 线程 在 持 有 锁 的 时 候 终止 ， 那 个 
数据 结构 就 永远 被 破坏 了 。 但 是 如 果 一 个 线程 在 操作 无 锁 数据 结构 时 终止 了 ， 就 不 会 丢 
失 任何 数据 ， 除 了 此 线程 的 数据 之 外 ， 其 他 线程 可 以 继续 正常 执行 。 

另 一 方面 ， 如 果 不 能 排除 线程 访问 数据 结构 ， 那 么 就 必须 确保 持 有 不 变量 或 选择 可 
以 持 有 的 替代 的 不 变量 。 并 且 ， 必 须 注意 你 加 于 操作 上 的 顺序 限制 。 为 了 避免 与 数据 竞 
争 有 关 的 未 定义 行为 ， 你 就 必须 在 修改 时 使 用 原子 操作 。 仅 仅 如 此 还 是 不 够 的 ， 你 必须 
确保 这 个 改变 以 正确 的 顺序 对 其 他 线程 是 可 见 的 。 所 有 这 些 都 意味 着 设计 线程 安全 数据 
结构 时 ， 不 使 用 锁 比 使 用 锁 要 困难 的 多 。 

因为 不 使 用 任何 锁 ， 因 此 无 锁 数据 结构 是 不 会 发 生死 锁 的 ， 尽 管 有 可 能 存在 活 锁 。 
当 两 个 线程 都 试图 修改 数据 结构 ， 但 是 对 于 每 个 线程 来 说 ， 另 一 个 线程 所 做 的 修改 都 会 
要 求 此 线程 的 操作 重新 被 执行 ， 因 此 这 两 个 线程 都 会 一 直 循环 和 不 断 尝试 ， 在 这 种 情况 
下 就 会 发 生活 锁 。 除 非 某 个 线程 先 到 达 (通过 协议 ， 通 过 更 快 ， 或 完全 靠 运气 ) AM 
此 循环 会 一 直 继续 下 去 。 在 这 个 简单 的 例子 中 ， 活 锁 通常 是 短暂 的 ， 因 为 它们 取决 于 线 
程 的 精确 调度 。 因 此 ， 活 锁 会 降低 性 能 而 不 会 导致 长 期 的 问题 但 是 也 是 需要 注意 的 事 
情 。 根据 定义 , 无 等 待 的 代码 无 法 忍受 活 锁 , 因为 它 执行 操作 的 步 怠 数 通常 是 有 上 限 的 。 
另 一 方面 ， 这 种 算法 比 别 的 算法 更 复杂 ， 并 且 即 使 当 没 有 线程 存 取 数据 结构 的 时 候 也 需 
要 执行 更 多 的 步骤 。 

这 就 带 来 了 无 锁 和 无 等 待 代码 的 另 一 个 缺点 , 尽管 它 可 以 增加 在 数据 结构 上 操作 的 
并 发 能 力 ， 并 且 减 少 了 线程 等 待 的 时 间 ， 但 是 它 可 能 降低 整体 的 性 能 。 首 先 ， 无 锁 代码 
使 用 的 原子 操作 可 能 比 非 原 子 操作 要 慢 很 多 。 并 且 与 基于 锁 数 据 结 构 的 互 斥 元 锁 代 码 相 
比 ， 无 锁 数据 结构 中 需要 更 多 的 原子 操作 。 不 仅 如 此 ， 硬 件 必须 在 存 取 同 样 的 原子 变量 
的 线程 间 同步 数据 。 正 如 你 将 在 第 8 章 中 看 到 的 ， 与 多 个 线程 存 取 同 样 的 原子 变量 相关 
的 乒乓 缓存 可 能 会 成 为 一 种 显著 的 性 能 消耗 。 总 而 言 之 ， 在 选择 任何 一 种 方式 前 ， 检 查 
基于 锁 的 数据 结构 和 无 锁 数据 结构 的 相关 性 能 方面 (是否 为 最 坏 等 待 时间 ， 平 均等 待 时 
间 ， 总 的 执行 时 间 ， 或 其 他 方面 ) 是 很 重要 的 。 

下 面 我 们 来 看 一 些 例子 。 


无 锁 数据 结构 的 例子 


为 了 展示 在 设计 无 锁 数据 结构 时 使 用 的 一 些 技术 , 我 们 来 看 一 些 简单 数据 结构 的 无 
锁 实现 。 我 们 不 仅 举例 子 描述 了 一 系列 有 用 的 数据 结构 的 实现 ， 而 且 将 举例 子 强调 无 锁 
数据 结构 设计 中 比较 特殊 的 部 分 。 


174 


72:71 


第 7 章 设计 无 锁 的 并 发 数据 结构 


就 像 之 前 提 到 的 ， 依 赖 于 使 用 原子 操作 的 无 锁 数据 结构 ， 以 及 与 之 相关 联 的 内 存 顺 
序 保 证 是 为 了 确保 数据 以 正确 的 顺序 对 其 他 线程 可 见 。 起 初 ， 我 们 为 所 有 原子 操作 都 使 
用 默认 的 memory order seq cst 内 存 顺 序 ， 因 为 这 是 最 简单 的 〈 记 住所 有 的 
memory order seq cst 操作 构成 了 全 局 顺序 ) 。 但 是 在 后 来 的 例子 中 ， 我 们 考虑 降 
低 一 些 排序 约束 到 memory order acquire, memory order release， 甚 至 
memory order relaxed 中 。 尽 管 在 这 些 例 子 中 都 未 直接 使 用 互 斥 元 锁 ， 但 是 需要 记 
住 的 是 , FUR std::atomic flag 保证 在 实现 中 是 不 使 用 锁 的 。 在 一 些 平台 上 , 有 
些 看 上 去 无 锁 的 代码 , 实际 上 却 可 能 使 用 了 C++ 标准 库 实 现 的 内 部 锁 (参见 第 5 章 )。 
在 这 些 平台 上 ， 一 个 简单 的 基于 锁 的 数据 结构 可 能 更 适合 。 但 是 还 有 比 这 更 重要 的 
是 ， 在 选择 一 种 实现 的 时 候 ， 必 须 先 确定 你 的 要 求 ， 然 后 考虑 有 哪些 选择 可 以 满足 
此 要 求 。 

因此 ， 我 们 追溯 到 一 种 最 简单 的 数据 结构 : Be. 


编写 不 用 锁 的 线程 安全 栈 


栈 的 基本 假设 是 相当 简单 的 ， 按 照 添加 结 点 的 逆序 来 检索 结 点 一 一 后 进 先 出 
(LIFO), HI, 确保 一 次 只 添加 一 个 值 到 栈 中 是 很 重要 的 。 另 一 个 线程 可 以 立刻 检索 结 
点 ,并且 确 保 只 有 一 个 线程 返回 给 定 的 数值 是 很 重要 的 。 最 简单 的 栈 是 一 个 链表 , head 
指针 指向 第 一 个 结 点 (这 个 结 点 将 被 第 一 个 检索 )， 并 且 每 个 结 点 都 按 顺 序 指向 下 一 个 
Bn. 

在 这 种 原则 下 ， 添 加 一 个 节点 相对 比较 简单 。 

1 创建 一 个 新 结 点 。 

2 将 它 的 next 指针 指向 当前 的 head 结 点 。 

3 将 head 结 点 指向 此 新 结 点 。 

在 单线 程 环境 中 ， 这 种 方法 是 可 以 的 。 但 是 如 果 别 的 线程 也 在 修改 栈 ， 那 么 这 种 方 
法 就 不 行 了 。 最 重要 的 是 ， 如 果 两 个 线程 同时 添加 结 点 ， 那 么 在 第 2 步 和 第 3 步 间 就 会 
存在 竞争 条 件 。 当 你 的 线程 在 第 2 步 读 取 头 结 点 和 第 3 步 更 新 头 结 点 之 间 ， 第 二 个 线程 
可 能 会 修改 nead 的 值 。 这 就 会 导致 另 一 个 线程 所 做 的 修改 无 效 或 者 有 更 坏 的 影响 。 在 
我 们 考虑 解决 这 一 竞争 条 件 之 前 ， 请 注意 一 旦 head 被 更 新 指向 你 新 创建 的 结 点 ， 别 的 
线程 就 可 以 读 取 该 结 点 。 因 此 ， 在 head 指向 新 结 点 之 前 将 新 结 点 完全 准备 好 也 是 至 关 
重要 的 ， 以 后 就 无 法 修改 此 结 点 了 。 

那么 ， 我 们 能 够 如 何 处 理 此 竞争 条 件 呢 ? 答案 就 是 在 第 3 步 中 使 用 一 个 原子 比 
较 /交换 操作 来 保证 从 你 在 第 2 步 中 读 取 它 开始 ，head 就 未 被 修改 过 。 如 果 head 
被 修改 了 , 那么 可 以 循环 和 再 次 尝试 。 清单 7.2 给 出 了 如 何 实现 不 使 用 锁 的 线程 安全 
Dus). 


7.2 无 锁 数据 结构 的 例子 


清单 7.2 ”实现 不 使 用 锁 的 线程 安全 push() 


template<typename T» 
class lock free stack 
{ 
private: 

struct node 


T data; 
node* next; 


node (T const& data_): 0 
data (data_) 
{} 
pi 
std: :atomic<node*> head; 
public: 
void push(T const& data) 


node* const new node-new node (data); -© 
new_node->next=head.10ad(); 
while(!head.compare exchange weak(new node-»next,new node)); +O 


} 
Ji 

这 段 代 码 恰好 符合 了 上 面 提 到 的 三 点 计划 : 创建 一 个 新 节点 @， 将 新 结 点 的 next 
指针 指向 当前 的 head®, 将 head 指向 这 个 新 结 点 @。 通 过 在 node 构造 函数 @ 中 填 
充 node 结构 体 的 数据 ， 这 就 可 以 保证 node 一 被 构造 好 就 可 以 被 使 用 ， 因 此 这 个 简单 
的 问题 就 被 解决 了 。 然 后 使 用 compare exchange weak () 来 确保 head 指针 的 值 与 
new_node->next@ 的 值 是 一 样 的。 如 果 这 两 个 值 是 一 样 的 ， 那 么 将 head 指向 
new_node。 这 段 代码 中 使 用 了 比较 /交换 函数 的 一 部 分 ， 如 果 它 返回 false 则 表明 此 
次 比较 没有 成 功 ( 例 如， 因为 另 一 个 线程 修改 了 head), 。 此 时 ， 第 一 个 参数 
(new node-»next) 的 值 将 被 更 新 为 head 当前 的 值 。 因 此 ， 通 过 此 次 循环 ， 就 不 需 
要 你 每 次 重 载 head， 因 为 编译 器 已 经 做 了 此 项 操作 。 同 样 ， 因 为 失败 时 只 需要 直接 循 
环 ， 此 可 以 使 用 compare exchange weak 。 在 某 些 架构 下 ， 它 比 
compare exchange strong 能 够 产生 更 优化 的 代码 (如 第 5 章 所 示 )。 

因此 , 在 没有 pop O 操作 的 情况 下 ， 先 按照 准则 来 快速 检查 一 下 push () 。 唯 一 能 
引发 异常 的 地 方 就 是 构造 新 结 点 的 时 候 @。 但 是 它 之 后 会 清除 这 些 , 并 且 链 表 没 有 被 修 
改 ， 因 此 这 是 非常 安全 的 。 因 为 你 建造 的 数据 将 被 存储 为 node 的 一 部 分 ， 并且 可 以 使 
JH compare exchange_weak() 来 更 新 head 指针 ,因此 这 里 没有 成 问题 的 竞争 条 件 。 
一 旦 比较 /交换 函数 成 功 了 , 结 点 就 被 插入 链表 并 可 以 被 使 用 了 。 这 里 没有 使 用 锁 ， 因 此 
不 会 产生 死 锁 ， 并 且 push O 函数 出 色 地 实现 了 功能 。 

当然 ,现在 已 经 有 了 在 栈 中 增加 数据 的 方法 ， 还 需要 在 栈 中 移出 数据 的 方法 。 从 表 
面 上 看 ， 这 要 简单 一 些 。 
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读 取 head 当前 的 值 。 

读 取 head->next, 

将 head->next 设置 为 head, 
返回 检索 到 的 结 点 的 值 。 

5 删除 检索 到 的 结 点 。 

然而 ， 在 存在 多 个 线程 的 情况 下 ， 这 个 问题 就 不 这 么 简单 了 。 如 果 同 时 有 两 个 
线程 从 栈 中 移出 元 素 ， 他 们 可 能 在 第 1 步 中 同时 读 取 了 相同 的 head 值 。 如 果 一 个 
线程 在 其 他 线程 执行 第 2 步 前 顺利 执行 到 第 5 步 ， 那 么 第 二 个 线程 将 被 解 引 用 悬挂 
指针 。 这 是 写 无 锁 代 码 中 最 大 的 问题 之 一 。 因 此 从 现在 开始 ， 先 忽略 第 5 步 并 且 先 
不 删除 结 点 。 

但 是 ， 这 也 没有 解决 掉 所 有 的 问题 。 这 里 存在 着 另 一 个 问题 ， 如 果 两 个 线程 读 取 同 
一 个 heaq 值 ， 那 么 它们 将 会 返回 同一 个 结 点 。 这 就 违背 了 栈 数 据 结构 的 目的 ， 因 此 必 
须 避 免 发 生 这 种 情况 。 你 可 以 用 push () 中 使 用 的 方法 来 解决 竞争 , 使 用 比较 /交换 来 更 
新 head。 如 果 比 较 /交换 失败 了 ， 要 么 是 因为 在 栈 中 插 人 了 一 个 新 结 点 ， 要 么 是 因为 另 
一 个 线程 从 栈 中 移出 了 你 打算 移出 的 结 点 。 无 论 是 哪 一 种 情况 , 都 需要 返回 到 第 1 步 ( 尽 
管 比 较 /交换 调用 可 以 重新 读 取 head), 

一 旦 比较 /交换 调用 成 功 了 , 那么 这 就 是 唯一 的 从 栈 中 移出 指定 结 点 的 线程 。 因 此 可 
以 安全 地 执行 第 4 步 。Pop O 如 下 所 示 。 


template<typename T» 
class lock free stack 


A 四 有 = 


public: 
void pop(T& result) 


node* old head-head.1load(); 
while(!head.compare exchange weak(old head,old head-»next)); 
result-old head-»data; 
) 
尽管 这 种 方法 很 好 很 简明 ， 但 是 除了 未 删除 的 结 点 外 还 有 一 些 别 的 问题 。 首 先 ， 当 
链表 为 空 时 它 就 行 不 通 了 ， 如 果 head 是 空 指针 ， 那 么 当 它 试图 读 取 next 指针 时 就 会 
导致 未 定义 的 行为 。 这 也 很 容易 通过 在 while 循环 中 检查 空 指针 来 解决 。 可 以 同时 在 
空 栈 上 引发 异常 或 者 返回 一 个 bool 来 表明 成 功 或 失败 。 
第 二 个 问题 就 是 异常 安全 问题 。 当 我 们 在 第 3 章 中 首次 介绍 线程 安全 栈 时 ， 你 可 以 
看 出 只 通过 值 返回 对 象 会 留 下 一 个 异常 安全 问题 ， 当 复制 返回 值 的 时 候 ， 如 果 引 发 了 蜡 
常 ， 那 么 此 值 就 会 被 丢失 。 在 这 种 情况 下 ， 传 递 对 值 的 引用 是 一 种 解决 方法 。 因 为 如 果 
抛 出 异常 的 话 ， 这 可 以 确保 栈 不 会 被 修改 。 可 惜 ， 这 里 不 能 使 用 这 种 方法 。 一 旦 你 知道 
这 是 唯一 一 个 返回 结 点 的 线程 ， 你 就 可 以 安全 地 复制 数据 了 。 这 就 意味 着 这 个 结 点 已 经 
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被 移出 队列 了 。 因 此 ， 通 过 引用 传递 返回 值 的 对 象 就 不 再 是 一 个 优势 了 ， 当 然 也 可 能 只 
是 返回 值 。 如 果 想 安全 地 返回 值 ， 就 必须 使 用 第 3 章 中 提 到 的 另 一 个 方法 ， 返 回 一 个 指 
向 数据 值 的 (智能) 指针 。 

如 果 返 回 智能 指针 ， 那 么 就 可 以 只 返回 空 指针 来 表明 没有 返回 值 ,但 是 这 就 要 求 数 
据 是 在 堆 上 被 分 配 的 。 如 果 将 堆 分 配 作 为 pop O 的 一 部 分 ， 你 仍然 没有 做 得 更 好 ， 因 
为 堆 分 配 也 可 能 会 引发 异常 。 反 而 ， 当 把 数据 push () 进 栈 时 ， 可 以 为 此 数据 分 配 内 
存 一 -反正 都 要 为 结 点 分 配 内 存 。 返 回 std: :shared_ptr<> 不 会 引发 异常 ,因此 pop () 
是 安全 的 。 将 这 些 总 结 起 来 得 到 清单 7.3 所 示 的 代码 。 


清单 7.3 ”缺少 结 点 的 无 锁 栈 


template<typename T> 
class lock_free_stack 
{ 
private: 
struct node 
A. data 现在 由 指针 持 有 
std::shared ptr«T» data; 
node* next; 


node(T const& data ): 
data(std::make shared«T» (data )) 


{} 


为 新 分 配 的 工 创建 
9 std::shared ptr 


br 


Std::atomic«node*» head; 
public: 
void push(T const& data) 


node* const new node-new node (data); 
new node-»next-head.load(); 
while(!head.compare exchange weak (new node-»next,new node)); 


std::shared ptr«T» pop() 在 解 引用 之 前 检查 old head 不 是 


{ ANP 
node* old_head=head.load() ; 上空 指针 


while(old head && 
!head.compare exchange weak(old head,old head-»next)); 
return old head ? old head-»data : std::shared ptr«T»(); 0 


数据 现在 由 指针 持 有 @， 因 此 需要 在 结 点 构造 函数 中 在 堆 上 分 配 数据 @。 在 
compare exchange_weak() 循环 中 解 引 用 old_head Ñi, 必须 检查 空 指针 。 最 后 ， 
如 果 存 在 与 结 点 相关 的 值 ， 那 么 就 返回 该 值 ， 否 则 就 返回 一 个 空 指针 。 注 意 ， 尽 管 这 是 
无 锁 的 ， 但 是 它 不 是 无 等 待 的 ， 因 为 在 push() 和 pop () 的 while 循环 中 ， 如 果 
compare_exchange_weak () 一 直 失败 的 话 ， 理 论 上 可 以 一 直 循环 下 去 。 
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如 果 有 垃圾 回收 器 在 你 后 面 打点 (比如 在 C# 或 Java 这 样 的 托管 语言 中 ), 那么 此 工 
作 就 已 完成 了 。 一 旦 没有 线程 存 取 此 结 点 ， 那 么 旧 的 结 点 被 收集 并 被 再 次 利用 。 然 而 ， 
没有 多 少 C++ 编译 器 有 垃圾 回收 器 ， 因 此 通常 需要 自己 整理 。 


7.2.2. 停止 恼人 的 泄漏 : 在 无 锁 数 据 结构 中 管理 内 存 


我 们 首先 观察 pop ()， 当 一 个 线程 删除 结 点 ， 而 另 一 个 线程 仍然 持 有 指向 此 结 点 的 
指针 时 ， 我 们 选择 泄漏 结 点 来 避免 竟 争 条 件 ， 那 么 就 只 能 解 引用 了 。 尽 管 如 此 ， 在 任何 
合理 的 C++ 程序 中 ， 泄 漏 内 存 都 是 不 可 接受 的 。 因 此 ， 我 们 必须 做 一 些 事 。 现 在 该 考虑 
这 个 问题 并 且 找 出 解决 办 法 了 。 

最 基本 的 问题 就 是 ， 你 想 释 放 一 个 结 点 , 但 是 直到 你 确保 没有 别 的 线程 持 有 指向 此 
结 点 的 指针 的 时 候 ， 你 才能 释放 此 结 点 。 如 果 只 有 一 个 线程 曾经 在 一 个 特定 的 栈 实 例 上 
调用 pop O ， 那 么 可 以 自由 释放 此 结 点 。 一 旦 结 点 被 添加 到 栈 中 ，PpPush ( ) 就 不 会 再 操 
作 此 结 点 了 。 因 此 调用 pop O 的 线程 就 一 定 是 唯一 一 个 操作 此 结 点 的 线程 ,并 且 可 以 安 
全 地 删除 此 结 点 。 

另 一 方面 ,如果 需要 处 理 多 个 线程 在 同一 个 栈 实 例 上 调用 pop O 的 情况 , 那么 就 需 
要 一 些 方法 来 追踪 何 时 可 以 安全 地 删除 结 点 。 这 就 从 根本 上 意味 着 你 需要 为 结 点 写 一 个 
专用 的 垃圾 回收 器 。 现 在 ， 这 可 能 听 上 去 很 可 怕 ， 尽 管 它 确实 很 讨厌 ， 但 是 也 不 是 太 精 
糕 。 只 需要 检查 结 点 ， 并 且 只 检查 在 pop () 中 存 取 的 结 点 。 不 需要 担心 在 push () 中 存 
取 的 结 点 ， 因 为 它们 只 能 被 一 个 线程 存 取 ， 直 到 它们 在 栈 上 为 止 。 然 而 ， 多 个 线程 可 能 
在 pop O 中 存 取 同 一 个 结 点 。 

如 果 没 有 线程 调用 pop ()， 那 么 可 以 删除 目前 等 待 删除 的 所 有 结 点 。 因 此 ， 当 你 获 
得 数据 时 ， 如 果 将 此 结 点 添加 到 “将 被 删除 ”的 列表 中 ， 那 么 当 没 有 线程 调用 pop O 
时 就 可 以 删除 它 ,如 何 知 道 有 没有 别 的 线程 在 调用 pop O We? 有 个 简单 的 方法 一 一 数 清 
数目 。 如 果 在 进入 的 时 候 计 数 器 加 一 ， 在 离开 的 时 候 计数 器 减 一 。 那 么 当 计 数 器 为 零 的 
时 候 ， 就 可 以 安全 地 删除 “将 被 删除 ”列表 中 的 结 点 。 当 然 ， 此 计数 器 必须 为 原子 计数 
器 ， 从 而 可 以 安全 地 被 多 个 线程 存 取 。 清 单 7.4 给 出 了 修改 后 的 pop O 函数 ， 并 且 清 单 
7.5 列 出 了 此 实现 的 支撑 函数 。 


清单 7.4 P$ pop() 中 没有 线程 时 回收 结 点 


template«typename T» 

class lock free stack 

{ 

private: af 原子 变量 
std::atomic<unsigned> threads in pop; 
void try reclaim(node* old head); 

public: 
std::shared ptr«T» pop() 


) 
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在 做 任何 其 他 事情 前 增 
++threads_in_pop; 加 计数 
node* old head-head.load(); 
while(old head && 
!head.compare exchange weak(old head,old head-»next)); 

Std::shared ptr«T» res; 
if(old head) 
3 es 如 果 可 能 ， 回 收 删除 的 

res.swap(old head-»data); eR 


} 
try reclaim(old head); 


return res; 从 结 点 中 提取 数据 ， 而 不 是 
复制 指针 


原子 变量 threads_in_pop@ 被 用 作 计 数目 前 有 多 少 线程 试图 从 栈 中 移出 数据 项 。 
在 pop () 开始 的 地 方 @ 增 加 计数 器 ,在 try reclaim O 中 减少 计数 器 , 而 一 旦 结 点 被 
移出 的 时 候 就 会 调用 此 函数 @。 因 为 可 能 将 延迟 删除 结 点 ， 因 此 可 以 使 用 swap () 来 将 
数据 从 结 点 中 删除 ©, 而 不 是 仅仅 复制 指针 。 因 此 当 不 再 需要 时 可 以 自动 地 删除 此 数据 ， 
而 不 会 因为 存在 对 未 删除 结 点 的 引用 而 一 直 保持 它 。 清 单 7.5 给 出 了 try_reclaim() 
的 内 部 实现 。 


清单 7.5 ”引用 计数 的 回收 机 制 


template<typename T> 
class lock free stack 


{ 


private: 


std::atomic<node*> to be deleted; 


static void delete nodes (node* nodes) 


{ 


} 


while (nodes) 
node* next-nodes-»next; 
delete nodes; 
nodes=next ; 


} 
列 出 将 要 被 删除 的 结 点 


void try reclaim(node* old head) 清单 


{ 


if (threads_in_pop==1) <0 
; node* nodes to delete-to be deleted.exchange (nullptr); 
T Ph ia rin 是 pop0 中 唯一 的 线程 吗 ? 
delete nodes (nodes to delete); <0 
wee if (nodes_to_delete) -© 


{ 
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chain pending nodes (nodes to delete); <Q 


delete old head; +@ 
} 


else 
{ 
chain pending node (old head); 0 
--threads in pop; 
) 
) 


void chain pending nodes (node* nodes) 


{ 跟随 下 一 个 指针 ， 链 至 


node* last=nodes; XR 
while(node* const next=last->next) 


{ 


last=next ; 


chain pending nodes (nodes, last) ; 
} 


void chain pending nodes (node* first,node* last) 


last-»next-to be deleted; 


while(!to be deleted.compare exchange weak( 
last-»next,first)); 
} 循环 以 保证 last->next 
正确 


void chain pending node (node* n) 


chain pending nodes (n,n); «-Qp 
} 


当 回 收 结 点 时 , 如 果 threads in pop 的 值 为 19，, IAHE pop O 中 这 就 是 唯一 的 线 
程 ， 这 就 意味 着 可 以 安全 删除 刚 移动 出 来 的 结 点 @， 并 且 可 能 安全 地 删除 等 待 的 结 点 。 如 
果 计 数 器 的 值 不 为 1， 那么 删除 任何 结 点 都 不 安全 ， 因 此 将 此 结 点 加 入 到 等 待 的 列表 中 @。 

现在 假设 threads_in_pop 的 值 为 1。 此 时 需要 回收 等 待 的 结 点 ， 如 果 不 回收 ,那么 这 
些 结 点 将 一 直 等 待 直到 栈 被 销毁 。 回 收 结 点 时 ， 首 先 用 原子 操作 exchange 来 查找 列表 e, 
然后 将 threads in pop 的 计数 减 一 @。 如 果 计 数 减 一 后 值 为 零 ， 就 可 以 得 知 没有 别 的 
线程 存 取 此 等 待 结 点 列表 。 可 能 会 有 新 的 等 待 结 点 ， 但 是 只 要 回收 列表 是 安全 的 ， 就 不 需 
要 操心 这 些 新 的 等 待 结 点 。 然 后 ， 调 用 delete nodes RERIK, FEWR O, 

如 果 计 数 减 一 后 值 不 为 零 ， 那 么 回收 结 点 就 不 安全 了 。 因 此 如 果 此 时 有 等 待 的 
Su 日 ， 那 么 就 将 此 结 点 插 人 到 等 待 删除 结 点 列表 的 尾部 @。 当 多 个 线程 同时 存 取 数 
据 结构 时 就 有 可 能 发 生 这 种 情况 。 别 的 线程 可 能 在 第 一 次 取 threads in Pop 值 @ 和 
查找 列表 @ 之 间 调 用 Pop () 。 这 就 可 能 在 列表 中 增加 新 的 结 点 ， 并 且 此 结 点 被 一 个 或 
多 个 线程 存 取 。 在 图 7.1 中 , 线程 C 增加 结 点 Y € to be deleted 列表 中 ,即使 线程 
B 仍然 引用 结 点 Y 作为 old_head, 并 且 会 读 取 此 结 点 的 next 指针 。 因 此 线程 A 在 删 
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除 结 点 的 时 候 不 可 避免 地 会 造成 线程 B 未 定义 的 行为 。 


初始 
to, be deleted —À[A]—- 


threads in pop == 0 


线程 A 调 用 pep () 并 且 在 首次 读 取 threads_in_pop 
之 后 被 try_reclaim() 抢 占 


to be deleted—>| a }—> 


threads in pop == 1 (线程 A) 


线程 B 调 用 pep() 并 且 在 首次 读 取 heaa 之 后 被 抢占 


old head 


to be deleted —À[A]—- 


threads in pop == 


(线程 A 和 B) 


线程 C 调 用 pep() 并 且 一 直 运 行 到 pep() 返 回 


head 


to be deleted 


threads in pop == 2 (线程 A 和 B、C 已 完成 ) 


线程 A 恢复 并 且 仅 在 执行 了 


to be deleted.exchange (nullptr) 之 后 才 被 抢占 


bea z} 
nodes to delete 


如 果 我 们 不 再 次 测试 threads_in_Pop 结 点 Y 和 A 会 被 删除 


threads in pop == 2 
to be deleted —— —» nullptr 


线程 B 人 恢复 并 且 为 调用 compare_exchange_strong() 
而 读 取 old_phead->next 

head 
old head 


pine fol: 


threads in pop == 


图 7.1 三 个 线程 并 发 调用 pop()， 在 回收 try_reclaim() 中 删除 的 结 点 之 后 必须 检查 threads in pope 
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为 了 将 等 待 删除 的 结 点 链接 到 等 待 列表 中 ， 需 要 重新 使 用 结 点 的 next 指针 来 将 它 
们 链接 起 来 。 对 于 重新 链接 一 个 已 存在 链表 到 列表 尾部 , 则 需要 遍历 链表 来 找到 尾部 9， 
用 当前 的 to_be_deleted 指针 来 符 代 最 后 一 个 结 点 的 next 指针 @， 并 且 存 储 链表 中 
的 第 一 个 结 点 作为 新 的 to be deleted 指针 国 。 必 须 在 循环 中 使 用 compare_ 
exchange weak 来 确保 没有 遗漏 其 他 线程 添加 的 结 点 。 这 种 做 法 的 好 处 是 当 链 表 发 生 
变化 时 ， 从 链 尾 更 新 next 指针 。 在 链表 中 添加 一 个 结 点 是 一 种 特殊 情况 ， 即 链表 中 添 
加 的 第 一 个 结 点 与 最 后 一 个 结 点 是 相同 的 @。 

在 低 负 载 的 情况 下 , 即 当 没有 进程 在 调用 pop O 这 样 一 种 合适 的 静态 点 的 时 候 , 这 
种 方法 是 很 有 效 的 。 尽 管 如 此 ， 在 回收 结 点 和 删除 刚 移出 的 结 点 之 前 @ 都 需要 检查 
threads in pop 计数 器 是 否 减 少 为 零 @， 这 是 因为 这 种 状态 是 很 短暂 的 。 删 除 结 点 
是 一 种 会 消耗 一 定时 间 的 操作 ， 并 且 别 的 线程 修改 列表 的 窗口 越 小 越 好 。 在 线程 第 一 次 
RH threads in pop 的 值 为 1 与 试图 删除 结 点 之 间 的 时 间 越 长 , 别 的 线程 调用 pop O 
以 及 threads_in pop 的 值 不 再 为 1 的 可 能 性 就 越 大 ， 因 此 就 阻止 了 此 结 点 被 真正 的 
删除 。 

在 高 负载 的 情况 下 ， 因 为 在 其 他 线程 调用 pop O 结束 之 前 就 会 有 别 的 线程 调用 
popO, ， 因 此 基本 上 不 可 能 有 这 种 静止 状态 。 在 这 种 情况 下 ，to_be_deleted 列表 很 
容易 就 越界 了 ， 并 且 再 次 内 存 泄露 。 如 果 没 有 任何 静止 状态 ， 那 么 就 需要 用 别 的 方法 来 
回收 结 点 。 关 键 点 就 是 识别 没有 别 的 线程 将 访问 某 个 特定 的 结 点 ， 那 么 就 可 以 回收 此 结 
点 了 。 人 迄今 为 止 ， 最 简单 的 方法 就 是 使 用 风险 指针 (hazard pointers), 


7.2.3 用 风险 指针 检测 不 能 被 回收 的 结 点 


术语 风险 指针 (hazard pointers) 是 Maged Michael 提 出 的 一 种 技术 。 基 本 思想 就 
是 如 果 一 个 线程 准备 访问 别 的 线程 准备 删除 的 对 象 ， 那 么 它 会 用 风险 指针 来 引用 对 象 ， 
因此 就 可 以 通知 别 的 线程 删除 此 对 象 可 能 是 有 风险 的 。 如 果 别 的 线程 引用 此 结 点 ， 并 且 
准备 通过 此 引用 来 访问 结 点 ， 那 么 删除 一 个 可 能 仍然 被 别 的 线程 引用 的 结 点 是 有 危险 
的 ， 因 此 它们 被 称 为 风险 指针 。 一 旦 不 再 需要 此 对 象 ， 风 险 指针 就 会 被 清除 了 。 如 果 你 
看 过 牛津 /剑桥 划船 比赛 ， 就 可 以 发 现 当 比 赛 开始 时 使 用 了 一 个 相似 的 方法 : AH A 
手 都 可 以 举 手 示意 他 们 没有 准备 好 。 当 任 何 一 个 舵手 举 手 的 时 候 , 裁判 都 不 能 开始 比赛 。 
如 果 舵 手 都 没有 举 手 ， 那 么 就 可 以 开始 比赛 了 。 但 是 只 要 比赛 尚未 开始 ， 任 何 一 个 舵手 
都 可 以 举 手 。 此 时 情况 就 会 发 生 改 变 。 

当 线 程 试图 删除 一 个 对 象 时 ， 它 必须 首先 检查 别 的 线程 所 持 有 的 风险 指针 。 如 果 没 


! «Safe Memory Reclamation for Dynamic Lock-Free Objects Using Atomic Reads and Writes," Maged M. 


Michael, in PODC '02: Proceedings of the Twenty-first Annual Symposium on Principles of Distributed 
Computing(2002), ISBN 1-58113-485-1 
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有 风险 指针 引用 此 对 象 ， 那 么 就 可 以 删除 此 对 象 。 否 则 ， 它 必须 之 后 才能 被 处 理 。 周 期 
性 地 检查 对 象 列表 来 确定 现在 是 否 可 以 删除 它 。 

用 这 种 方式 描述 的 时 候 是 比较 简单 明了 的 ， 那 么 在 C++ 中 如 何 实现 呢 ? 

首先 ， 需 要 一 块 共享 内 存 来 存储 正在 访问 对 象 的 指针 ， 即 风险 指针 本 身 。 此 地 址 必 
须 对 所 有 线程 可 见 ， 并 且 每 个 访问 此 数据 结构 的 线程 都 需要 其 中 一 段 内存 。 如 何 正确 并 
且 有 效 地 分 配 它们 ， 我 们 会 在 后 面 章 节 介 绍 。 先 假设 已 经 有 这 样 一 个 函数 
get hazard pointer for current thread ()， 它 返 回 风险 指针 的 引用 。 当 线程 
试图 解 引用 正在 读 取 的 指针 的 时 候 ， 需 要 设置 它 的 风险 指针 。 在 这 里 我 们 以 解 引用 列表 
的 head 值 为 例 。 


std::shared ptr«T» pop () 


{ 


std: :atomicevoid*>& hp=get_hazard_pointer_for_current_thread() ; 


node* old_head=head.load() ; 
node* temp; 0 


do 


{ 


temp=old_head; 


hp. store (old_head) ; +O 
old_head=head.load() ; 
} while (old_head!=temp) ; +O 
pre cate 


} 
在 while 循环 中 ， 确 保 在 读 取 旧 的 head 指针 @ 和 设置 风险 指针 e 之 间 ， 结 点 
未 被 删除 。 在 此 窗口 内 ， 别 的 线程 不 知道 你 正在 读 取 这 个 特定 的 结 点 。 幸 运 的 是 ， 如 果 
旧 的 头 指针 将 被 删除 ,那么 头 结 点 肯定 会 发 生 改 变 ， 因 此 必须 持续 循环 直到 确定 头 指针 
与 之 前 设置 的 风险 指针 相同 日 。 使 用 风险 指针 取决 于 当 它 引用 的 对 象 被 删除 后 ， 仍 然 可 
以 安全 地 使 用 此 指针 。 如 果 使 用 缺 省 的 new 和 delete 实现 ， 那 么 就 会 导致 未 定义 的 
行为 。 因 此 ， 需 要 确保 你 的 实现 可 以 保证 这 一 点 ， 或 者 使 用 允许 这 种 行为 的 自 定义 分 配 
Ai 0 
现在 , 我 们 已 设置 好 风险 指针 ， 就 可 以 完成 op O 中 剩余 的 代码 。 此 时 没有 线程 将 
会 删除 你 所 占用 的 结 点 了 。 那 么 每 次 重 载 019_head， 都 需要 在 解 引用 新 读 取 的 指针 前 
更 新 风险 指针 。 一 旦 从 列表 中 获得 了 结 点 ， 就 可 以 清除 风险 指针 。 如 果 此 时 没有 别 的 风 
险 指针 引用 此 结 点 ， 就 可 以 安全 删除 此 结 点 。 否 则 ， 就 将 此 结 点 加 入 等 待 稍 后 删除 的 结 
点 列表 。 清 单 7.6 演示 了 使 用 此 策略 的 pop O 的 完整 实现 。 


清单 7.6 ”使 用 风险 指针 的 pop() 实 现 


std::shared ptr<T> pop () 


{ 


std::atomic<void*>& hp=get_hazard_pointer_for_current_thread() ; 
node* old_head=head.load() ; 
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{ 一 直 循环 到 你 将 风险 指 


ode* i 
icis 针 设置 到 head 上 
{ 
temp-old head; 
hp.store(old head); 
old head-head.load(); 
} while(old head!-temp); 
) 
while(old head && 
!head.compare exchange strong(old head,old head-»next)); 
hp.store(nullptr) ; 
std::shared_ptr<T> res; 当 你 完成 时 清除 风险 


if (old head) 指针 在 你 删除 一 个 结 点 前 
{ 检查 风险 指针 是 否 引 
res.swap(old head-»data); 用 它 
if(outstanding hazard pointers for(old head) ) 
{ 
reclaim later(old head); 0 
) 
else 
{ 
delete old_head; 0 
delete nodes with no hazards(); 0 


) 


return res; 


首先 ， 将 设置 风险 指针 放 到 外 部 循环 中 ， 如 果 比 较 /交换 失败 ， 则 重 载 old_head@ 。 
这 里 使 用 compare exchange strong() 是 因为 在 这 个 while 循环 中 确实 有 效 ， 
compare_exchange_weak () 中 虚假 的 错误 会 导致 不 必要 地 重 置 风险 指针 。 这 就 确保 
了 在 解 引 用 old head 前 设置 了 正确 的 风险 指针 。 一 旦 声明 此 结 点 是 你 的 , 就 可 以 清除 
你 的 风险 指针 @。 如 果 你 得 到 一 个 结 点 , 就 需要 检查 别 的 线程 拥有 的 风险 指针 是 否 引用 
它 @。 如 果 存 在 这 样 的 风险 指针 ， 那 么 必须 将 它 放 入 到 稍 后 回收 的 列表 中 @。 否 则 ， 就 
可 以 立刻 删除 它 ©, BG, WH reclaim late () 来 检查 所 有 结 点 。 如 果 没 有 别 的 风险 
指针 引用 这 些 结 点 ， 那 么 可 以 安全 删除 它们 @。 任 何 有 风险 指针 的 结 点 都 将 留待 下 一 个 
线程 调用 pop0。 

当然 , 在 这 里 有 很 多 新 函数 
reclaim later(),outstanding hazard pointers for() ,以 及 delete nodes 
with_no_hazards () 中 有 很 多 细节 部 分 一 一 让 我 们 来 了 解 这 些 函 数 并 且 看 看 它们 是 如 何 
工作 的 。 

调用 get hazard pointer for current thread () 给 线程 分 配 风 险 指 针 的 
有 具体 机 制 并 不 影响 程序 的 逻辑 ( 稍 后 就 可 以 看 到 对 效率 有 影响 )。 因 此 我 们 先 用 一 个 简 


get hazard pointer for current thread(), 
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单 的 结构 来 实现 ， 一 个 固定 大 小 数组 存放 线程 D 和 指针 对 。get_ hazard pointer. 
for current thread () 检索 整个 数组 来 寻找 第 一 个 空闲 的 位 置 , 并 且 将 此 位 置 的 ID 
值 设 为 当前 线程 的 ID 。 当 线程 退出 时 ， 此 位 置 的 ID 值 被 重 置 为 默认 值 
std::thread::id ), ， 从 而 此 位 置 就 被 释放 出 来 了 ， 如 清单 7.7 所 示 。 


清单 7.7 get hazard pointer for current thread() 的 简单 实现 


unsigned.const max hazard pointers-100; 
struct hazard pointer 


{ 


std: :atomic<std::thread::id> id; 
std::atomic<void*> pointer; 


hi 


hazard_pointer hazard pointers[max hazard pointers]; 


class hp owner 


{ 


hazard_pointer* hp; 


public: 
hp owner(hp owner const&) =delete; 
hp owner operator-(hp owner const&) =delete; 
hp owner(): 
hp (nullptr) 
{ 


for(unsigned i=0;i<max_hazard_pointers; ++i) 


{ 
std::thread::id old id; 
if(hazard pointers[i].id.compare exchange strong( 
old id,std::this thread::get id())) 
{ 


hp=&hazard_pointers [i]; 试 着 获取 风险 指针 的 所 
break; 有 权 
) 
) 
if(!hp) 0 
{ 


} 


throw std::runtime_error("No hazard pointers available") ; 


} 


std: :atomic<void*>& get pointer() 
{ 
} 


~hp_owner () -© 
{ 


return hp-»pointer; 


hp-»pointer.store (nullptr); 
hp->id.store(std::thread::id()); 
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Std::atomic«void*»& get hazard pointer for current thread () + 
{ 


thread_local static hp_owner hazard; 


return hazard.get_pointer () ; -© ue e ANS 己 的 风险 

get hazard pointer for current thread() 的 实现 看 似 简单 ， 其 实 不 然 e. 
它 用 hp_owner@ XAH thread local 变量 来 存储 当前 线程 的 风险 指针 。 然 后 它 
返回 此 对 象 的 指针 @。 它 的 原理 如 下 ; 每 个 线程 第 一 次 调用 此 函数 的 时 候 ， 创建 一 个 
新 的 hp_owner 实例 。 这 个 新 实例 构造 器 搜索 所 有 者 /指针 对 的 表格 来 寻找 一 个 值 , 此 
值 没有 所 有 者 。 它 使 用 compare exchange strong () 来 检查 没有 所 有 者 的 值 并 且 
获得 它 @。 如 果 compare exchange strong O 失败 了 ， 那 么 就 说 明 另 一 个 线程 拥 
AKE, 那么 就 需要 去 检查 下 一 个 值 。 如 果 compare exchange strong () MUS, 
那么 当前 线程 就 成 功 获得 此 值 。 此 时 就 存储 此 值 ， 并 且 停止 检索 日 。 如 果 在 整个 列表 
中 都 没有 找到 一 个 空闲 的 值 @， 那 么 就 表示 有 太 多 线程 使 用 了 风险 指针 ， 此 时 就 抛 出 
异常 。 

一 旦 为 一 个 给 定 的 线程 创造 了 hp_owner KA, 那么 之 后 的 存 取 就 变 得 更 快 了 ， 
为 缓存 了 指针 ， 就 不 需要 再 次 扫描 表格 了 。 

当 每 个 线程 退出 时 , 为 该 线程 创造 的 hp owner 实例 就 被 销毁 了 。 析 构 函 数 在 设置 
所 有 者 的 ID 的 值 为 std: :thread: :id() 前 将 指针 的 值 重 置 为 nullptr， 这 样 稍 后 
别 的 线程 就 可 以 重新 使 用 此 值 ©, 

用 这 种 方式 实现 get hazard pointer for current thread() , 那么 
outstanding hazard pointer for current thread() 的 实现 就 变 得 简单 了 ， 
只 需要 检索 整个 风险 指针 表 来 寻找 这 个 位 置 。 


bool outstanding hazard pointers for(void* p) 


( 


for(unsigned i=0;i<max_hazard_pointers;++i) 
if (hazard pointers[i].pointer.load()--p) 


return true; 


) 


return false; 


) 


现在 甚至 都 不 需要 检索 表 来 得 知 每 个 位 置 是 否 拥有 所 有 者 , 没有 所 有 者 的 位 置 将 会 
有 一 个 空 指针 ， 因 此 这 个 比较 函数 将 返回 false， 这 样 就 简化 了 代码 。 

在 简单 链表 中 ,reclaim later() 和 delete nodes with no hazards() 可 
以 工作 ，reclaim later() 只 添加 结 点 至 列表 中 ，delete nodes with_ 
no hazards () 扫描 整个 列表 ， 删 除 没有 风险 的 值 。 清 单 7.8 就 是 一 个 实现 。 


7.2 ”无 锁 数据 结构 的 例子 


清单 7.8 回收 函数 的 简单 实现 


template<typename T» 
void do delete(void* p) 


{ 
} 


struct data to reclaim 


{ 


delete static_cast<T*>(p) ; 


void* data; 
std: :function<void(void*)> deleter; 
data_to_reclaim* next; 


template<typename T> 
data_to_reclaim(T* p): 0 
data (p), 
deleter (&do_delete<T>), 
next (0) 


{} 


~data_to_reclaim() 


{ 
} 


deleter (data) ; +O 


}; 
std::atomic<data to reclaim*» nodes to reclaim; 


void add to reclaim list(data to reclaim* node) +O 


{ 


node-»nextsnodes to reclaim.load(); 
while(!nodes to reclaim.compare exchange weak (node->next, node) ) ; 


) 


template«typename T» 
void reclaim later(T* data) «0 


{ 
} 


void delete nodes with no hazards() 


{ 


add to reclaim list(new data to reclaim(data)); -© 


data to reclaim* current-nodes to reclaim.exchange (nullptr); 
while (current) 


{ 


data to reclaim* const next-current-»next; 


«0 


if(Ioutstanding hazard pointers for (current-»data)) ES 7) 
{ 
delete current; 0 
) 
else 
{ 
add to reclaim list (current); +O 


} 


current-next; 
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首先 , 我 希望 你 发 现 reclaim later () 不 是 一 个 普通 的 函数 ,而 是 一 个 函数 模板 O, 
这 是 因为 风险 指针 是 一 种 通用 的 工具 ， 因 此 不 希望 绑 定 到 具体 的 结 点 。 你 已 经 使 用 
std: :atomic<void*> 来 存储 指针 了 。 因 此 需要 处 理 任何 指针 类 型 ， 但 是 不 能 使 用 
Void* 类 型 。 因 为 当 你 删除 数据 项 的 时 候 ，delete 函数 需要 指针 的 实际 类 型 。 
date to reclaim 的 构造 器 可 以 很 好 地 处 理 这 个 问题 ， 就 如 以 下 所 示 。 
reclaim later() 只 需要 为 你 的 指针 生成 一 个 新 的 date to reclaim Xfi, 并 且 将 
它 加 入 到 回收 列表 中 ©, add to reclaim list () 本 身 € 是 一 个 基于 列表 头 结 点 的 
简单 compare exchange weak () 循环 。 

因此 ， 回 到 data to reclaim 的 构造 函数 @， 这 个 构造 函数 也 是 一 个 模板 。 它 
将 被 删除 数据 存储 为 data 成 员 的 void* 类 型 。 然 后 存储 指向 do delete () 实例 的 指 
ff, do delete () 是 一 个 简单 的 函数 ， 将 提供 的 voidx 类 型 确定 为 选 好 的 指针 类 型 ， 
然后 删除 它 所 指向 的 对 象 。std: :function<> 可 以 安全 地 实现 这 个 函数 指针 ， 因 此 
data to reclaim 的 析 构 函数 可 以 调用 存储 的 函数 来 删除 数据 @。 

当 你 在 列表 中 增加 结 点 时 , 不 会 调用 data to reclaim 的 析 构 器 。 当 没有 风险 指 
针 指 向 此 结 点 时 就 会 调用 此 析 构 函数 。 这 是 delete nodes with no hazards () W 
Ht. 

delete nodes with no hazards () 首先 用 一 个 简单 的 exchange () 来 声明 所 
有 将 被 回收 的 结 点 列表 , 这 一 简单 但 是 关键 的 步 又 确保 了 这 是 将 回收 这 个 结 点 集合 的 
唯一 线程 。 别 的 线程 可 以 自由 向 列表 中 增加 结 点 或 者 试图 回收 它们 ， 并 且 不 会 影响 此 线 
程 的 操作 。 

然后 ， 只 要 列表 中 仍然 有 结 点 ， 就 轮流 检查 每 个 结 点 来 看 是 否 存在 风险 指针 @。 如 
果 没 有 ， 则 安全 删除 此 位 置 的 值 ( 即 清除 了 存储 的 数据 ) @。 否 则 ， 就 将 此 项 增加 到 稍 
后 回收 列表 中 @。 

尽管 这 种 简单 实现 能 够 安全 回收 删除 的 结 点 ， 但 是 它 会 增加 很 多 处 理 难度 。 扫 描 风 
险 指针 数组 需要 检查 max hazard pointers 原子 变量 ， 并 且 每 次 调用 pop( ) 的 时 候 
都 会 执行 这 个 操作 。 原 子 操作 必定 是 很 慢 的 一 一 通常 在 计算 机 CPU 上 运行 时 会 比 实现 
同样 效果 的 非 原 子 操作 慢 100 倍 一 一 这 就 使 得 pop () 变 成 很 耗资 源 的 操作 。 不 仅 需要 扫 
描 将 要 删除 结 点 的 风险 指针 列表 ， 而 且 需 要 扫描 等 待 列表 中 每 个 结 点 的 风险 指针 列表 。 
这 当然 不 是 个 好 主意 。 如 果 列 表 中 有 max hazard pointers 个 结 点 ， 那 么 就 得 扫描 
这 些 结 点 存储 的 风险 指针 。 天 啊 ! 必须 找到 一 种 更 好 的 方法 。 


使 用 风险 指针 的 更 佳 的 回收 策略 


当然 ， 有 更 好 的 方法 。 这 里 我 将 介绍 一 种 简单 的 风险 指针 实现 来 解释 这 种 机 制 。 第 
一 件 事 就 是 用 内 存 资源 换取 效率 。 你 不 再 试图 回收 任何 结 点 除非 表 中 的 结 点 数 多 于 
max hazard _ pointers， 而 不 再 每 次 都 调用 pop O 来 检查 回收 列表 中 每 个 结 点 。 用 
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这 种 方式 可 以 保证 至 少 回收 一 个 结 点 。 如 果 只 是 等 到 表 中 有 max hazard. 
pointers+1 个 结 点 ， 这 种 方法 也 没有 更 好 。 一 旦 你 得 到 max hazard pointers 个 
结 点 ， 就 开始 调用 pop O 来 回收 结 点 ， 这 种 方法 也 没有 更 好 。 但 是 如 果 你 等 到 表 中 有 
2*max hazard pointers 个 结 点 ， 就 可 以 确保 收回 至 少 max hazard pointers 
个 结 点 ， 并 且 在 你 回收 任何 结 点 前 至 少 会 nax_hazard pointers KHH pop O. X 
种 方法 就 比较 好 了 。 你 在 max hazard pointers 次 调用 pop O 的 时 候 都 会 检查 
2xmax hazard pointers 个 结 点 ， 并 且 至 少 回 收 max_hazard pointers 个 结 点 。 
而 不 需要 每 次 调用 push O 的 时 候 检查 max hazard pointers 个 结 点 。 这 样 是 很 有 
效 的 ， 每 次 调用 pop O 都 会 检查 两 个 结 点 ， 回 收 一 个 结 点 。 

这 种 方案 也 有 缺点 〈 除 了 增加 内 存 使 用 ) ， 需 要 计数 回收 列表 中 的 结 点 ， 这 就 意味 
着 要 使 用 原子 计数 ， 并 且 多 个 线程 还 在 竞争 访问 此 回收 列表 。 如 果 有 共享 内 存 ， 就 可 以 
用 增加 的 内 存 使 用 换取 一 个 更 好 的 回收 策略 。 每 个 线程 在 线程 本 地 变量 上 有 自己 的 回收 
列表 。 因 此 就 不 需要 用 来 计数 的 原子 变量 以 及 存 取 列 表 。 相 对 的 ， 就 分 配 了 
max hazard pointers*max hazard pointers 个 结 点 。 如 果 线 程 在 回收 完 它 所 有 
的 结 点 前 退出 了 ,它们 就 可 以 像 以 前 一 样 存储 在 全 局 列表 中 ， 并 且 加 入 到 下 一 个 执行 回 
收 操作 的 线程 的 本 地 列表 中 。 

风险 指针 的 另 一 个 缺点 是 他 们 涉及 到 IBM 提交 的 专利 申请 '!。 如 果 在 一 个 承认 此 专 
利 有 效 的 国家 写 软件 ， 那 么 就 需要 确保 获得 一 个 合适 的 许可 。 一 些 无 锁 内 存 回收 机 制 可 
以 共用 此 技术 。 这 是 一 个 很 活路 的 研究 领域 ， 很 多 公司 都 在 竭尽 所 能 地 提交 专利 申请 。 
你 可 能 会 提出 这 样 的 疑问 , 为 什么 我 花 了 这 么 多 篇 幅 介 绍 一 种 很 多 人 都 不 能 使 用 的 一 种 
技术 ， 这 是 一 个 合理 的 问题 。 首 先 ， 有 可 能 在 不 获得 许可 的 情况 下 使 用 该 技术 。 例 如 ， 
如 果 你 在 GPL2 下 开发 免费 软件 ， 你 的 软件 可 以 被 BM 的 非 不 主张 条 款 ` 所 覆盖 。 就 可 以 
使 用 该 技术 。 第 二 ， 更 重要 的 一 点 是 ， 对 这 项 技术 的 解释 展示 了 在 写 无 锁 代 码 的 时 候 需 
要 考虑 哪些 重要 的 事情 ， 如 原子 操作 的 开销 。 

因此 ， 是 否 存在 可 以 用 在 无 锁 代 码 的 非 专利 内 存 技术 ? 幸运 的 是 ， 确 实 有 。 一 种 技 
术 就 是 引用 计数 。 


7.2.4 使 用 引用 计数 检测 结 点 


回顾 7.2.2 节 ， 删 除 结 点 的 问题 就 在 于 检测 哪些 结 点 正在 被 别 的 线程 读 取 。 如 果 可 


1 Maged M. Michael, U.S. Patent and Trademark Office application number 20040107227, “Method for efficient 
implementation of dynamic lock-free data structures with safe memory reclamation.” 

2 GNU General Public License http://www.gnu.org/licenses/gp].html 

3 IBM Statement of Non-Assertion of Named Patents Against OSS, http J/www.ibm.com/ibm/licensing/ 
patents/pledgedpatents.pdf 
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以 精确 识别 出 哪些 结 点 正在 被 引用 以 及 何 时 没有 线程 读 取 这 些 结 点 , 那么 就 可 以 删除 此 
结 点 。 风 险 指 针 通过 存储 读 取 每 个 结 点 的 线程 数 来 处 理 此 问题 。 引 用 技术 通过 存储 一 定 
数量 的 线程 读 取 结 点 来 处 理 这 个 问题 。 

这 种 方法 看 上 去 更 好 更 直接 ， 但 是 在 实际 中 很 难处 理 。 首 先 ， 你 可 能 认为 
std: :shared ptr<> 可 以 处 理 这 种 问题 ， 毕 竞 ， 这 是 一 个 引用 计数 指针 。 不 幸 的 是 ， 尽 
^ std: :shared ptr<> 中 的 一 些 操作 是 原子 的 ,但 是 它们 不 能 保证 是 无 锁 的 。 尽 管 这 与 
原子 类 型 上 的 任何 操作 并 没有 不 同 ， 但 是 在 许多 情况 下 std: : shared_pPtr<> 被 使 用 ， 并 
且 使 得 原子 操作 是 无 锁 的 会 导致 使 用 这 个 类 有 花费 。 如 果 你 的 平台 提供 这 样 一 个 实现 ， 即 
当 std::atomic is lock free(&some shared ptz) 返 回 tzue, 所 有 的 内 存 回收 事 
件 都 离开 。 如 清单 7.9 所 示 ， 其 中 只 使 用 std::shared ptr «node», 


清单 7.9 使 用 无 锁 的 std::shared _ptr<> 的 无 锁 栈 实现 


template<typename T» 
class lock free stack 


{ 


private: 


struct node 


{ 
std::shared_ptr<T> data; 
std::shared_ptr<node> next; 


node (T const& data_): 
data(std::make shared«T» (data )) 
Ü 


h 


Std::shared ptr«node» head; 
public: 
void push(T const& data) 


Std::shared ptr«node» const new_node=std: :make_shared<node> (data); 
new node-»next-head.load(); 
while(!std::atomic compare exchange weak(&head, 

&new node-»next,new node)); 


Std::shared ptr«T» pop() 


std: :shared_ptr<node> old head-std::atomic load(&head); 

while(old head && !std::atomic compare exchange weak (&head, 
&old head,old head-»next)); 

return old head ? old head-»data : std::shared ptr«T»(); 


在 可 能 的 情况 下 , std: : shared_Ptr<> 实 现 不 是 无 锁 的 , 需要 手工 处 理 引 用 计数 。 
一 种 可 能 的 技术 涉及 为 每 个 结 点 使 用 不 止 一 个 而 是 两 个 引用 计数 , 一 个 内 部 计数 和 
一 个 外 部 计数 。 这 两 个 计数 值 之 和 是 结 点 总 的 引用 数 。 外 部 计数 始终 与 结 点 指针 在 一 起 ， 
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并 且 每 次 读 取 指针 的 时 候 外 部 计数 增 一 。 当 读 取 结 点 结束 时 ， 内 部 计数 减 一 。 读 取 指 针 
这 样 一 个 简单 操作 会 导致 外 部 计数 增 一 ， 并 且 在 此 操作 结束 时 内 部 计数 减 一 。 

当 内 部 计数 /指针 对 不 在 需要 时 〈 即 多 个 线程 不 再 访问 结 点 时 ) ， 内 部 计数 增加 外 部 
计数 的 值 减 一 ， 并 废除 外 部 计数 。 一 旦 内 部 计数 的 值 为 零 ， 就 没有 引用 结 点 ， 此 时 可 删 
除 此 结 点 。 使 用 原子 操作 来 更 新 共享 数据 也 是 很 重要 的 。 现 在 我 们 来 看 一 个 使 用 这 种 技 
术 来 确保 结 点 只 会 被 安全 收回 的 无 锁 栈 的 实现 。 

更 好 的 内 部 数据 结构 和 push () 的 实现 如 清单 7.10 所 示 。 


清单 7.10 ”在 使 用 两 个 引用 计数 的 无 锁 栈 中 入 栈 结 点 


template<typename T» 
class lock free stack 


( 
private: 
struct node; 


struct counted node ptr 0 
{ 
int external_count; 
node* ptr; 
struct node 
{ 
std::shared_ptr<T> data; Ad 


Std::atomic«int» internal count; 
counted node ptr next; 


node(T const& data ): 
data(std::make shared«T» (data )), 
internal count (0) 


{} 
}; 


std: :atomic<counted_node_ptr> head; 0 


public: 
-lock free stack() 


{ 
} 


void push(T const& data) 0 


{ 


while (pop ()) ; 


counted_node_ptr new_node; 

new node.ptr-new node (data); 

new node.external count-1; 

new node.ptr-»next-head.load(); 
while(!head.compare exchange weak (new node.ptr-»next,new node)); 
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首先 ， 在 counted node ptr 结构 中 包含 了 外 部 变量 与 结 点 的 指针 @。 在 node 
结构 体 卓 中 将 使 用 counted node ptr 类 型 的 next 指针 以 及 内 部 变量 @。 因 为 
counted node ptr 是 一 种 简单 的 结构 ， 因 此 在 std: :atomic<> 模 板 中 使 用 它 作为 
列表 的 头 结 点 e, 

在 这 些 支持 双 字 比 较 和 交换 操作 的 平台 上 ， 这 个 结构 足够 小 ， 使 得 std: :atomic 
<counted_node_ptr> 是 无 锁 的 。 如 果 不 是 在 你 的 平台 上 ， 那 么 最 好 使 用 清单 7.9 中 
提 到 的 std::shared ptr<>， 因 为 当 类 型 太 大 使 得 平台 的 原子 指令 不 能 实现 时 ， 
std: :atomic<> 将 使 用 一 个 互 斥 元 来 保证 原子 性 〈 因 此 最 后 使 得 你 的 “无 锁 ” 算 法 变 
成 基于 锁 的 算法 ) 。 或 者 ， 如 果 你 想 限 制 计数 的 位 数 ， 并 且 你 知道 你 的 平台 中 指针 有 空 
闲 位 (例如 ， 地 址 空间 只 有 48 位 但 是 指针 有 64 位 ) ， 你 可 以 在 单个 字 中 将 计数 存储 在 
指针 的 空闲 位 中 。 这 种 方法 需要 与 平台 相关 的 知识 ， 这 就 超出 了 本 书 的 范围 了 。 

push () 相对 简单 一 些 @。 构造 一 个 指向 新 分 配 结 点 的 counted_node_ptr, 并 将 
‘EM next 赋值 为 当前 的 head,。 之 后 用 compare exchange weak () 来 给 head 赋值， 
就 像 之 前 的 清单 所 示 。 设 置 计 数 器 时 ， 将 内 部 计数 设 为 零 ， 外 部 计数 设 为 一 。 因 为 这 是 
新 创建 的 结 点 ， 只 有 一 个 外 部 引用 (Bl head 本 身 )。 

HH, pop O 的 实现 也 复杂 了 一 些 ， 如 清单 7.11 所 示 。 


清单 7.11 使 用 两 个 引用 计数 从 无 锁 栈 中 出 栈 一 个 结 点 


template<typename T> 
Class lock free stack 
{ 
private: 
void increase_head_count (counted_node_ptr& old_counter) 


{ 


counted_node ptr new_counter; 


do 
new_counter=old_counter; 
++new_counter.external_count; 


while(!head.compare exchange strong(old counter,new counter)); <0 


old counter.external count-new counter.external count; 


) 


public: 
std::shared_ptr<T> pop()s 
{ 
counted node ptr old head-head.load(); 
for(:;;) 
{ 
increase head count (old head); 
node* const ptr-old head.ptr; -© 
LECT per) 
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{ 


return std::shared ptr«T»(); 
if(head.compare exchange strong (old head,ptr-»next)) 0 


std::shared ptr«T» res; 
res.swap(ptr-»data); 0 


int const count increase-old head.external count-2; 


oo 


if(ptr-»internal count.fetch add(count increase)-- 
-count increase) 


( 


) 
return res; <0 


delete ptr; 


else if(ptr-»internal count.fetch sub(1)--1) 


delete ptr; +@ 
} 
} 
Fi 

这 里 ， 一 旦 你 载 人 了 head 的 值 ， 就 必须 将 引用 此 head 结 点 的 外 部 计数 的 值 增 一 ， 
用 以 表明 你 引用 了 此 结 点 并 且 确 保 解 引用 是 安全 的 。 如 果 在 增加 引用 计数 前 解 引用 此 指 
针 ， 那 么 另 一 个 线程 就 可 以 在 你 读 取 这 个 结 点 前 释放 该 结 点 ， 因 此 使 得 它 变 成 悬挂 指针 。 
这 是 使 用 两 个 分 开 的 引用 计数 的 主要 原因 。 通 过 增加 外 部 引用 计数 , 就 可 以 保证 直到 你 访 
问 时 指针 仍然 是 有 效 的 。 在 compare_exchange_strong () 循环 内 部 增加 计数 的 值 @， 
确保 了 没有 别 的 线程 在 此 时 改变 它 。 

一 旦 增加 了 计数 , 为 了 访问 它 指向 的 结 点 , 可 以 安全 解 引 用 从 head RAN ptr 的 
值 @。 如 果 指 针 为 空 ， 表 明 位 于 链表 的 尾部 没有 位 置 了 。 如 果 指 针 不 为 空 ,就 可 以 通过 
在 head 上 调用 compare exchange strong () 来 移动 结 点 ©., 

如 果 compare exchange_strong() 成 功 了 ， 就 可 以 拥有 该 结 点 ， 并 且 交 换 出 
data 以 备 以 后 返回 它 @。 这 就 确保 了 就 算 别 的 线程 读 取 栈 的 时 候 一 直 持 有 指向 此 结 点 
的 指针 ，data 也 不 需要 一 直 保持 。 然 后 就 可 以 使 用 原子 操作 fetch add 将 结 点 外 部 
计数 的 值 加 到 内 部 计数 上 @。 如 果 当 前 引用 计数 的 值 为 零 ， 那 么 先前 你 增加 的 值 〈《 即 
fetch add 的 返回 值 ) 就 是 负数 ， 此 时 就 可 以 删除 这 个 结 点 。 请 注意 你 增加 的 值 比 外 
部 计数 的 值 减 少 2@8。 你 已 经 从 列表 中 移出 了 结 点 ， 因 此 计数 减 一 ， 并 且 这 个 线程 不 在 
读 取 这 个 结 点 ， 因 此 计数 的 值 再 次 减 一 。 无 论 是 否 删除 此 结 点 ， 程 序 都 结束 了 ， 因 此 可 
以 返回 data@ 。 

如 果 比 较 /交换 © 失败 了 ， 则 表明 在 此 之 前 另 一 个 线程 移动 了 该 结 点 ， 或 者 另 一 个 
线程 人 栈 了 一 个 新 结 点 。 不 管 怎样 ， 你 都 需要 用 比较 /交换 返回 的 head 新 值 重 新 开始 。 
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但 是 首先 你 必须 减少 你 试图 移动 的 结 点 的 引用 计数 。 该 线程 不 会 再 读 取 它 了 。 如 果 这 是 
持 有 引用 的 最 后 一 个 线程 〈 因 为 另 一 个 线程 将 它 从 栈 中 移出 ) ， 那 么 内 部 引用 计数 的 值 
为 一 ， 因 此 减少 一 将 使 得 值 变 为 零 。 在 这 种 情况 下 ， 可 以 在 循环 之 前 删除 此 结 点 @。 

迄今 为 止 ， 所 有 原子 操作 使 用 了 默认 的 std::memory order seq cst 内 存 顺 
序 。 在 大 多 数 系统 中 ， 这 种 方法 比 别 的 内 存 顺 序 消耗 更 多 的 执行 时 间 以 及 同步 开销 。 现 
在 ， 你 有 决定 数据 结构 逻辑 的 权利 ， 就 可 以 考虑 放松 一 些 内 存 顺 序 要 求 。 可 以 减少 使 用 
栈 的 不 必要 的 开销 。 因 此 ， 先 不 考虑 栈 ， 考 虑 一 下 无 锁 队 列 的 设计 。 检 查 栈 操作 并 问 问 
自己 ， 对 于 一 些 操作 是 否 可 以 使 用 更 简单 的 内 存 顺 序 并 且 获得 同样 的 安全 性 ? 


7.2.5 将 内 存 模型 应 用 至 无 锁 栈 


在 改变 内 存 顺序 前 ， 你 需要 检查 操作 以 及 它们 之 间 的 关系 。 然 后 就 可 以 寻找 提供 这 
些 关系 的 最 小 内 存 顺 序 。 为 了 实现 这 一 点 ， 就 必须 在 不 同 场景 下 从 线程 角度 考虑 情况 。 
最 简单 的 场景 就 是 一 个 线程 人 栈 一 个 数据 项 ， 并 且 稍 后 另 一 个 线程 将 那个 数据 项 出 栈 ， 
我 们 先 考虑 这 种 情况 。 

在 这 种 简单 情况 下 ， 涉 及 数据 的 三 个 重要 部 分 。 第 一 部 分 是 用 来 传输 head 数据 的 
counted_node_ptr, 第 二 部 分 是 head 引用 的 结 点 数据 结构 。 第 三 部 分 是 结 点 指向 的 
数据 项 。 

线程 Push () 的 时 候 首先 构造 数据 项 和 结 点 ， 然 后 设置 head。 线程 Pop O 的 时 候 首先 
加 载 head 的 值 ， 然 后 基于 head 做 一 个 比较 /交换 循环 来 增加 引用 计数 ， 最 后 读 取 结 点 数 
据 结构 来 得 到 next 的 值 。 在 这 里 可 以 看 出 这 样 一 种 关系 ，next 的 值 是 一 个 普通 的 非 原子 
性 对 象 ， 因 此 为 了 安全 读 取 它 ， 必 须 存 在 存储 〈 人 栈 线程 执行 的 操作 ) 发 生 在 加 载 (出 栈 
线程 执行 的 操作 ) 之 前 这 样 一 种 关系 。 因 为 push() 中 唯一 的 原子 操作 是 
compare exchange weak ()， 所 以 需要 一 个 释放 操作 来 实现 在 线程 间 实 现 这样 一 种 先后 
顺序 关系 ， 而 且 compare exchange weak () 必须 是 std::memory order release 
或 者 更 强 的。 如 果 compare exchange weak () 失败 了 ， 那 么 就 继续 循环 并 且 不 做 任何 
改变 ， 因 此 在 这 种 情况 下 需要 使 用 std: :memory order relaxed, 
void push(T const& data) 

counted node ptr new node; 

new node.ptr-new node (data); 

new node.external count-1; 

new node.ptr-»next-head.load(std::memory order relaxed) 


while(!head.compare exchange weak (new node.ptr-»next,new node, 
Std::memory order release,std::memory order relaxed)); 


那么 Pop O 的 代码 怎么 样 呢 ?为 了 实现 这 种 先后 顺序 关系 , 你 必须 在 读 取 next 之 
前 有 一 个 std: :memory order acquire 或 者 更 强 的 操作 。 解 引用 指针 读 取 的 next 


7.2 ”无 锁 数据 结构 的 例子 195 


值 是 increase head count () 中 的 compare exchange strong O 读 取 的 旧 值 。 
因此 如 果 成 功 的 话 就 需要 有 先后 顺序 。 正 如 在 push () 中 一 样 ， 如 果 交 换 失 败 的 话 ， 只 
需要 继续 循环 ， 因 此 失败 时 可 以 使 用 任意 的 顺序 。 


void increase head count(counted node ptr& old counter) 


{ 


counted node ptr new counter; 


do 


new counters-old counter; 
*4new counter.external count; 


) 


while(!head.compare exchange strong(old counter,new counter, 
Std::memory order acquire,std::memory order relaxed)); 


old counter.external count-new counter.external count; 


) 

如 果 compare exchange strong O 调用 成 功 ， 那 么 读 取 的 结 点 的 ptr 值 设置 
为 old counter 中 存储 的 值 。 因 为 pusho 中 的 存储 是 一 个 释放 操作 ， 并 且 
compare exchange strong () 是 一 个 获取 操作 ， 因 此 存储 与 加 载 同步 而 且 存在 先后 
发 生 顺 序 的 关系 。 所 以 ，push O 中 存储 ptr 发 生 在 pop O 中 读 取 ptr->next 之 后 ， 
因此 是 安全 的 。 

注意 ， 在 最 初 的 nead.load O 中 内 存 顺 序 并 不 是 很 重要 ， 因 此 可 以 安全 使 用 
std::memory order relaxed, 

CT—4P, compare exchange strong() 将 head 的 值 设 为 old head.ptr-» 
next。 是 否 需要 操作 来 确保 线程 的 数据 完整 性 ”如 果 交 换 成 功 就 读 取 Ptz->data， 此 时 
就 需要 确保 在 线程 中 push () 存储 ptr->data 的 操作 发 生 在 线程 加 载 它 之 前 。 尽 管 如 此 ， 
你 已 经 得 到 如 下 保证 ，increase_head_count () 中 的 获取 操作 保证 了 push O 线程 中 的 
存储 和 比较 /交换 操作 存在 同步 关系 。 因 为 push () 线程 中 存储 data 发 生 在 存储 head 之 
前 , 调用 increase head count () 发 生 在 加 载 Ptz->qata 之 前 ， 所 以 就 存在 一 种 先后 
顺序 关系 。 并 且 即 使 Pop () 中 的 比较 /交换 使 用 std: :memory_order_relaxed, 这 种 先 
后 顺序 关系 也 是 存在 的 。ptr->data 改变 的 唯一 的 地 方 就 是 调用 swap () ， 并 且 没有 别 的 
线程 可 以 在 同一 个 结 点 上 进行 操作 ， 这 就 是 整个 比较 /交换 。 

如 果 compare exchange strong O 失败 了 ， 直 到 下 一 次 循环 的 时 候 才 会 访问 
old head 的 新 值 。 并 且 你 决定 了 increased head count () 中 的 std::memory 
order acquire 是 足够 的 ， 因 此 std: :memory_order_relaxed 也 是 足够 的 。 

那么 其 他 线程 呢 ? 是 否 需 要 更 强 的 方式 来 保证 别 的 线程 是 安全 的 ? 答案 是 否定 的 。 因 
为 只 有 比较 /交换 操作 会 改变 head, 因为 这 些 是 “ 读 一 修改 一 写 ” 操作 , 它们 通过 push O 
中 的 比较 /交换 形成 了 部 分 释放 顺序 。 因 此 ,push () 中 的 compare exchange weak () 
与 调用 increase head count () 中 的 compare exchange strong () 同步 , 它 读 取 


196 


第 7 章 ， 设 计 无 锁 的 并 发 数据 结构 


存储 的 值 ， 即 使 别 的 线程 同时 在 修改 head.。 

因此 ， 你 基本 上 完成 了 ， 只 需要 处 理 修改 引用 计数 的 fetch aad () 的 操作 。 返 回 
这 个 结 点 数据 的 线程 可 以 继续 ， 因 为 没有 别 的 线程 会 修改 这 个 结 点 数据 。 尽 管 如 此 ， 任 
何 没有 成 功 取 值 的 线程 知道 别 的 线程 的 确 修改 了 结 点 数据 ， 它 使 用 swap O 获得 引用 的 
数据 项 。 因 此 ， 为 了 避免 数据 竞争 ， 你 需要 确保 swap () 发 生 在 delete 之 前 。 实 现 它 
的 一 个 简单 方式 就 是 在 成 功 返回 分 支 的 fetch ada () 中 使 用 std::memory order 
release， 并 且 在 再 次 循环 分 支 的 fetch add() 中 使 用 std: :memory order 
acquire。 还 可 以 进一步 简化 设计 ， 只 有 一 个 线程 进行 删除 操作 (将 计数 设置 为 零 的 线 
程 )， 也 只 有 此 线程 需要 进行 获取 操作 。 因 为 fetch_add() 是 一 个 “ 读 一 修改 一 写 ” 操 
作 ， 它 组 成 了 释放 顺序 的 一 部 分 ， 因 此 可 以 使 用 额外 的 load () 。 如 果 再 次 循环 分 支 将 
引用 计数 减 为 零 ， 那 么 为 了 保证 同步 关系 可 以 使 用 std::memory order acquire 
来 重 载 引 用 计数 ， 并 且 fetch add() 可 以 使 用 std: :memory order relaxed。 清 
单 7.12 所 示 就 是 使 用 新 的 pop O 的 栈 的 最 终 实现 。 


清单 7.12 使 用 引用 计数 和 放松 原子 操作 的 无 锁 栈 


template<typename T> 
class lock free stack 
private: 

struct node; 


struct counted node ptr 
int external count; 
node* ptr; 
bi 
struct node 
std::shared_ptr<T> data; 
std: :atomic<int> internal count; 
counted_node_ptr next; 


node (T const& data_): 
data (std: :make_shared<T>(data_)), 
internal_count (0) 
{} 
}; 


std::atomic<counted node ptr» head; 


void increase head count(counted node ptr& old counter) 
{ 

counted node ptr new counter; 

do 


{ 
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new counter-old counter; 
++new counter.external count; 
while(!head.compare exchange strong(old counter,new counter, 
std::memory order acquire, 
std::memory order relaxed)); 


old counter.external count-new counter.external count; 


) 


public: 


~lock free stack() 


{ 
} 


void push(T const& data) 


{ 


while (pop()); 


counted_node_ptr new_node; 

new_node.ptr=new node (data) ; 

new node.external count-1; 

new node.ptr-»next-head.load(std::memory order relaxed) 

while(!head.compare exchange weak (new node.ptr-»next,new node, 
Std::memory order release, 
std: :memory_order_relaxed) ) ; 


std::shared_ptr<T> pop() 


counted_node_ptr old_head= 
head.load(std::memory order relaxed); 
for(;;) 
{ 
increase head count (old_head) ; 
node* const ptr-old head.ptr; 
if(!ptr) 


{ 
} 


if(head.compare exchange strong(old head,ptr-»next, 
Std::memory order relaxed)) 
{ 


return std::shared ptr«T»(); 


std::shared_ptr<T> res; 
res.swap (ptr->data) ; 


int const count increase-old head.external count-2; 


if(ptr-»internal count.fetch add(count increase, 
std: :memory order release)---count increase) 


{ 
} 


return res; 


delete ptr; 


} 


else if(ptr-»internal count.fetch add(-1, 
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Std::memory order relaxed)==1) 


{ 


ptr-»internal count.load(std::memory order acquire); 
delete ptr; 
) 
) 
) 
Fi 
这 是 一 个 实验 , 但 是 最 后 成 功 了 。 通 过 使 用 更 放松 的 操作 ， 在 没有 影响 正确 性 的 情 
况 下 提升 了 性 能 。 正 如 你 所 见 ， 这 里 的 pop O 实现 有 37 行 代码 ， 在 清单 6.1 基于 锁 的 
栈 中 pop () 有 8 行 代码 , 在 清单 7.2 不 使 用 内 存 管理 的 无 锁 栈 中 pop () 有 7 行 代码 。 现 
在 我 们 考虑 写 一 个 无 锁 队 列 ， 你 可 以 看 到 一 个 相似 的 模式 ， 无 锁 代 码 中 的 很 多 复杂 性 都 


来 自 于 管理 内 存 。 


7.2.6 ”编写 不 用 锁 的 线程 安全 队列 


队列 与 栈 有 所 不 同 。 因 为 队列 中 push () 和 pop O 操作 读 取 了 数据 结构 的 不 同 部 
分 ， 而 栈 中 这 两 个 操作 读 取 了 相同 的 头 结 点 。 所 以 同步 要 求 就 不 一 样 了 。 你 需要 确保 一 
端 所 作出 的 改变 能 被 另 一 端正 确 地 读 取 。 尽管 如 此 , 清单 6.6 中 队列 的 try_pop () 结构 
与 清单 7.2 简单 无 锁 栈 中 的 pop () 区 别 并 不 是 很 大 , 因此 可 以 合理 假设 无 锁 代 码 不 会 不 
相似 。 

如 果 以 清单 6.6 作为 基础 ， 就 需要 两 个 结 点 指针 ， 一 个 指针 指向 head， 一 个 指针 
指向 tai1l。 多 个 线程 将 会 读 取 它 们 ， 为 了 去 掉 相 关 的 互 斥 元 ， 最 好 是 原子 操作 。 下 面 
我 们 来 做 一 些小 的 改变 来 看 看 效果 如 何 。 清 单 7.13 展示 了 效果 。 


清单 7.13 单 生产 者 单 消费 者 的 无 锁 队 列 


template<typename T» 
class lock free queue 
{ 
private: 
struct node 
( 
std::shared ptr«T» data; 
node* next; 
node(): 
next (nullptr) 
{} 
jg 
Std::atomic«node*» head; 
Std::atomic«node*» tail; 


node* pop head() 


) 


public: 


7.2 无 锁 数 据 结构 的 例子 


node* const old head-head.load(); 
if (old head--tail.load()) «o 


{ 
} 


head. store (old_head->next) ; 
return old_head; 


return nullptr; 


lock free queue(): 


ü 


head (new node),tail(head.load()) 


lock_free_queue (const lock_free_queue& other)=delete; 
lock free queue& operator-(const lock free queue& other)-delete; 


-lock free queue () 


{ 


} 


while (node* const old_head=head.1load() ) 


{ 


head. store (old_head->next) ; 
delete old_head; 


} 


std::shared_ptr<T> pop() 


{ 


} 


node* old head-pop head(); 
if(!old head) 


{ 
} 


std::shared_ptr<T> const res(old head-»data); +O 
delete old head; 
return res; 


return std::shared_ptr<T>(); 


void push(T new value) 


{ 


je 


std::shared_ptr<T> new data(std::make shared«T» (new value)); 


node* p=new node; 

node* const old tail-etail.load0; <Q Ò 
old tail->data.swap (new_data) ; -© 

old tail->next=p; +@ 


tail.store(p); 0 


199 


看 起 来 似乎 没什么 不 好 。 如 果 一 次 只 有 一 个 线程 调用 push () ， 并 且 只 有 一 个 线程 
调用 pop () ， 就 工作 的 很 好 了 。 在 这 种 情况 下 ， 重 要 的 是 push O 和 pop O HREM 
序 关系 以 确保 可 以 安全 获取 data, tail 存储 @ 与 tail MRO 同时 发 生 ， 存 储 先前 
结 点 的 data 指针 @ 发 生 在 存储 tail 之 前 ;加 载 tail 发 生 在 加 载 data 指针 之 前 @， 
因此 存储 data 发 生 在 加 载 之 前 ， 这 就 是 安全 的 。 这 是 一 个 性 能 良好 的 单 生 产 者 、 单 江 
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费 者 (single-producer, single-consumer, SPSC) 队列 。 

当 多 个 线程 同时 调用 push () 或 多 个 线程 同时 调用 pop( ) 的 时 候 就 会 存在 问题 。 首 
FRA push () 。 如 两 个 线程 同时 调用 push () ， 它 们 都 会 分 配 新 节点 作为 新 的 哑 元 结 
点 全 ， 都 会 读 取 相同 的 tail@， 并 且 设 置 date 和 next 指针 日、@ 时 都 会 同时 更 新 
同一 个 结 点 的 数据 成 员 。 这 就 是 数据 竞争 1 

pop head () 中 也 存在 类 似 的 问题 。 如 果 两 个 线程 同时 调用 pop_head， 就 会 读 取 
同一 个 head， 并 且 会 用 同一 个 next 指针 覆盖 旧 值 。 这 两 个 线程 现在 认为 他 们 得 到 了 
相同 的 结 点 一 一 这 是 有 很 大 危害 的 。 你 不 但 要 确保 只 有 一 个 线程 pop () 结 点 , FARE 
确保 别 的 线程 可 以 安全 访问 head 的 下 一 个 结 点 。 这 就 是 无 锁 栈 的 Pop () 遇 到 的 问题 ， 
因此 很 多 方法 可 以 用 在 这 里 。 

如 果 pop () 是 一 个 “已 解决 的 问题 ”, 那么 push () We? 问题 就 是 为 了 得 到 push () 
和 pop O 的 先后 顺序 关系 ， 需 要 在 更 新 tail 前 设置 哑 元 结 点 的 数据 项 。 这 就 意味 着 同时 
调用 push () 会 在 这 些 相同 的 数据 项 上 产生 竞争 ， 因 为 他 们 读 取 了 相同 的 tail 指针 。 


1. 处 理 push() 中 的 多 个 线程 


一 种 选择 是 在 真正 的 结 点 间 增 加 一 个 哑 元 结 点 。 这 样 ， 当 前 tail 结 点 只 需要 更 新 
EM next 指针 ， 因 此 可 以 是 原子 的 。 如 果 一 个 线程 成 功 地 将 它 的 next 指针 从 空 改变 
为 新 结 点 ， 就 代表 它 成 功 地 增加 了 指针 ， 否则 , 它 就 必须 再 次 开始 并 且 重 新 读 取 tail, 
这 就 需要 对 稍微 改变 pop () 来 丢弃 有 空 数据 指针 的 结 点 , 并 且 再 次 循环 。 缺点 就 是 每 次 
调用 pop( ) 都 会 移出 两 个 结 点 ， 并 且 会 有 两 倍 内 存 分 配 。 

第 二 种 选择 是 使 得 data 指针 是 原子 的 , 并 且 调 用 比较 /交换 来 设置 它 。 如 果 调 用 成 
功 ， 那 么 这 就 是 tail 结 点 ， 并 且 可 以 安全 地 将 next 指针 设置 为 新 结 点 ， 然 后 更 新 
tail。 如 果 另 一 个 线程 已 经 存储 了 此 数据 ， 导 致 比较 /交换 失败 了 ， 那 么 就 再 次 循环 ， 
重新 读 取 tail 然后 重新 开始 。 WR std: :shared ptr<> 的 原子 操作 是 无 锁 的 , 那么 
整个 就 是 无 锁 的 。 如 果 不 是 ， 就 需要 别 的 方法 。 一 种 可 能 就 是 让 pop () 返回 
std::unique ptr«» (毕竟 ,这 是 对 象 的 唯一 引用 ) 并 且 将 数据 用 普通 指针 存储 在 队 
列 里 。 这 就 允许 你 将 它 存储 为 std::atomic<T*> ,这样 你 就 可 以 使 用 
compare exchange strong () 。 如 果 你 使 用 清单 7.11 中 的 引用 计数 方法 在 多 线程 的 
情况 下 处 理 pop () ， 那 么 push () 就 如 清单 7.14 所 示 。 


清单 7.14 首次 《很 逊 的 ) 尝试 修订 push() 


void push(T new value) 


Std::unique ptr«T» new data(new T(new value)); 
counted node ptr new next; 
new next.ptr-new node; 
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new next.external count-1; 
for(;;) 
{ 
node* const old tail-tail.load(); 0 
T* old_data=nullptr; 
if(old tail-»data.compare exchange strong( 
old data,new data.get())) 


{ 


old_tail->next=new_next; 
tail.store (new_next.ptr) ; -© 
new data.release(); 
break; 
} 
} 
} 


使 用 引用 计数 方法 避免 了 特定 的 竞争 ， 但 是 这 不 是 push O 中 唯一 的 竞争 。 如 果 你 
看 看 清单 7.14 push () 的 修订 版 本 , 就 会 发 现 栈 中 有 这 样 一 段 代 码 : 加 载 一 个 原子 指 
&r @ 并 且 解 引用 那个 指针 @。 同 时 ， 另 一 个 线程 可 以 更 新 那个 指针 日 ， 最 后 指向 再 分 
配 的 结 点 (在 pop O 中 )。 如 果 在 你 解 引 用 那个 指针 前 再 分 配 那个 结 点 ， 就 会 产生 不 确 
定 的 行为 。 天 哪 ! 它 试图 像 head 一 样 在 tail 中 增加 一 个 外 部 计数 ， 但 是 每 个 结 点 在 
队列 先前 的 结 点 的 next 指针 中 已 经 有 一 个 外 部 计数 了 。 同 一 个 结 点 拥有 两 个 外 部 计数 
就 意味 着 要 需要 修改 引用 计数 方法 来 避免 太 早 删除 该 结 点 。 你 可 以 这 样 处 理 , 即 在 node 
结构 体 中 计算 外 部 计数 的 数量 ， 并 且 当 每 个 外 部 计数 被 销毁 的 时 候 (以 及 将 相关 的 外 部 
计数 加 到 内 部 计数 的 时 候 ) 减少 它 的 数量 。 如 果 结 点 的 内 部 计数 为 零 并 且 没 有 外 部 计数 ， 
此 时 就 可 以 安全 删除 该 结 点 。 最 初 我 是 从 Joe Seigh 的 Atomic Ptr Plus 项 目 :了 解 到 的 技 
术 。 清 单 7.15 给 出 了 使 用 这 种 方法 的 Push O , 


清单 7.15 “在 无 锁 队 列 中 用 引用 计数 tail 来 实现 push() 


template<typename T» 
class lock free queue 
{ 
private: 

struct node; 


struct counted node ptr 
{ 
int external_count; 
node* ptr; 


eg 


std::atomic«counted node ptr» head; 
Std::atomic«counted node ptr» tail; 0 


struct node_counter 


1 Atomic Ptr Plus Project, http://atomic-ptr-plus.sourceforge.net/ 
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unsigned internal count:30; 
unsigned external counters:2; -© 


p 


Struct node 

{ 
Std::atomic«T*» data; 
Std::atomic«node counter» count; -© 
counted node ptr next; 


node () 
node_counter new_count; 
new_count.internal_count=0; 
new count.external counters-2; 0 
count . store (new_count) ; 


next.ptr-nullptr; 
next.external count-0; 


ys 


public: 

void push(T new value) 

{ 
std: :unique_ptr<T> new_data (new T(new value)); 
counted node ptr new next; 
new next.ptr-new node; 
new next.external count-1; 
counted node ptr old tail-tail.load(); 


for(;;) 


{ 


increase external count (tail,old_tail) ; -© 


T* old data-nullptr; 

if(old tail.ptr-»data.compare exchange strong( +@ 
old data,new data.get())) 

{ 


old tail.ptr-»next-new next; 

old tail-tail.exchange (new next); 

free external counter (old tail); —9 
new data.release(); 

break; 


) 


old tail.ptr-»release ref(); 


}; 

清单 7.15 中 , tail 和 head 一 样 都 是 atomic<counted node ptr», Jf H node 
有 一 个 count 成 员 代替 了 之 前 的 internal count6,count 是 包含 internal count 
和 额外 的 external counters 成 员 @ 的 结构 体 。 注 意 这 里 的 external counters 
只 包含 两 个 比特 ， 因 为 最 多 只 有 两 个 计数 器 。 通 过 使 用 一 个 比特 来 表示 它 ， 并 且 
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internal count 是 一 个 30 比特 的 值 , 总 的 计数 器 大 小 可 以 保持 32 比特 。 这 就 使 得 在 确保 
整个 结构 体 在 32 比特 和 64 比特 的 机 器 上 都 能 用 一 个 机 器 字 表示 的 情况 下 ， 还 能 有 足够 的 范 
围 来 表示 比较 大 的 内 部 计数 值 .为 了 避免 竞争 条 件 ,将 这 些 计数 作 为 一 个 值 来 更 新 是 很 重要 的 ， 
稍 后 你 将 看 到 。 将 此 结构 体 保存 在 一 个 机 器 字 中 在 许多 平台 中 使 原子 操作 更 容易 是 无 锁 的 。 

node 初始 化 的 时 候 ，internal_count 被 设 为 零 ，external counters 的 值 
设 为 28。 因 为 一 旦 你 将 结 点 添加 到 队列 中 ， 每 个 新 结 点 都 会 引用 tail 以 及 先前 结 点 
的 next 指针 ,push O 与 清单 7.14 中 类 似 ,除了 你 为 了 调用 结 点 data 成 员 的 compare_ 
exchange strong () 而 解 引用 从 tail 加 载 的 值 之 外 @ ， 你 还 调用 一 个 新 函数 
increase external count () 来 增加 计数 0, 并 且 之 后 在 旧 的 tail 上 调用 free_ 
external counter () O9, 

处 理 好 push () 之 后 ， 我 们 来 看 看 pop () 。 清 单 7.16 展示 了 它 ， 并 且 将 清单 7.11 
中 pop () 实现 的 引用 计数 逻辑 与 清单 7.13 中 的 队列 pop 逻辑 结合 在 一 起 。 


清单 7.16 ”从 使 用 引用 计数 tail 的 无 锁 队 列 中 将 结 点 出 队列 


template<typename T» 
class lock free queue 
{ 
private: 

struct node 


{ 
E 


public: 
std: :unique_ptr<T> pop() 


{ 


void release ref(); 


counted node ptr old head-head.load(std::memory order relaxed); 0 
for(;7) 
{ 
increase external count (head,old head); +O 
node* const ptr=old_head.ptr; 
if(ptrsstail.load().ptr) 
{ 
ptr-»release ref(); -© 
return std::unique ptr<T>(); 


if(head.compare exchange strong(old head,ptr-»next)) Q 
{ 

T* const res-ptr-»data.exchange (nullptr) ; 

free external counter(old head); 

return std::unique ptr«T» (res); 
La Maha Oe 0 
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你 在 开始 循环 前 @ 以 及 增加 加 载 值 的 外 部 引用 前 @ Mold nead fh. iR nead 
与 tail 是 同一 个 结 点 ， 那 么 就 可 以 释放 该 引用 四 并 且 返 回 一 个 空 指针 ， 因 为 队列 中 没 
有 数据 。 如 果 队 列 中 有 数据 ， 你 就 想 获得 此 数据 ， 并 且 调用 compare_exchange_ 
strong () 来 实现 @。 如 同 清单 7.11 中 的 栈 一 样 , 它 将 外 部 计数 和 指针 作为 一 个 值 来 比 
较 ， 如 果 任何 一 个 改变 了 ， 就 在 释放 引用 后 重新 循环 @。 如 果 compare exchange 
strong () 成功 了 , 你 就 获得 了 结 点 中 的 数据 , 因此 在 你 释放 移出 的 结 点 的 外 部 计数 后 ， 
可 以 将 此 值 返回 给 调用 者 @。 一 旦 外 部 引用 计数 都 被 释放 了 并 且 内 部 计数 值 变 为 零 , 就 
可 以 删除 结 点 了 。 清 单 7.17、 清 单 7.18 和 清单 7.19 展示 了 处 理 这 些 的 引用 计数 函数 。 


清单 7.17 释放 无 锁 队 列 的 结 点 引用 


template<typename T> 
class lock free queue 
{ 
private: 
struct node 
{ 
void release ref() 
{ 
node_counter old_counter= 
count.load(std::memory order relaxed); 
node counter new counter; 
do 
{ 
new_counter=old_counter; 
--new_counter.internal_count; +@ 
} 
while(!count.compare exchange strong( 0 
old counter,new counter, 
std::memory order acquire,std::memory order relaxed)); 


if(!new counter.internal count && 
!new counter.external counters) 


( 
delete this; «e 
) 
} 
um 
ls 


node::release ref () 的 实现 只 在 清单 7.11 的 lock_ free stack: :pop() 
上 改变 了 一 些 对 应 的 代码 。 清 单 7.11 中 的 代码 只 需要 处 理 一 个 外 部 计数 ， 因 此 可 以 
用 一 个 简单 fetch_sub。 而 现在 即使 只 想 修改 internal count 域 ， 也 需要 原子 
更 新 整个 count@ ,因此 需要 一 个 比较 /交换 循环 @。 一 旦 你 减少 internal count, 
如 果 内 部 计数 和 外 部 计数 都 变 为 零 ， 那 么 这 就 是 最 后 一 个 引用 ， 就 可 以 安全 删除 该 
ure, 


7.2 无 锁 数 据 结构 的 例子 205 


清单 7.18 在 无 锁 队 列 中 获得 结 点 的 新 引用 


template«typename T» 
class lock free queue 


{ 


private: 


static void increase_external_count ( 
Std::atomic«counted node ptr»& counter, 
counted node ptr& old counter) 


counted node ptr new counter; 


do 


{ 


new counter-old counter; 
-«new counter.external count; 


) 


while(!counter.compare exchange strong( 
old counter,new counter, 


std: :memory_order_acquire, std: :memory_order_relaxed) ) ; 


old_counter.external_count=new_counter.external_count; 


js 
清单 7.18 则 相反 。 这 次 ,你 得 到 一 个 新 的 引用 并 且 增 加 外 部 计数 , 而 不 是 释放 一 个 


引用 。increase external count () 与 清单 7.12 中 的 increase head count () 


函数 类 似 ， 除 了 它 使 用 一 个 静态 成 员 函 数 来 将 外 部 计数 作为 第 一 个 参数 来 更 新 ， 而 不 是 
在 固定 计数 器 上 进行 操作 。 


清单 7.19 ”在 无 锁 队 列 中 释放 结 点 的 外 部 计数 


template<typename T> 
class lock free queue 


( 


private: 


Static void free external counter(counted node ptr &old node ptr) 


{ 
node* const ptr=old_node_ptr.ptr; 
int const count increase-old node ptr.external count-2; 
node counter old counter- 
ptr-»count.load(std::memory order relaxed); 


node counter new counter; 


do 

new counter-old counter; Jag 

--new counter.external counters; 

new counter.internal count«-count increase; -© 
while(!ptr-»count.compare exchange strong( 0 


old counter,new counter, 
std::memory order acquire,std::memory order relaxed)); 
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if(!new counter.internal count && 
!new counter.external counters) 


| delete ptr; 0 

} 
)s 

5 increase external count () 相对 的 是 free external counter(), iX 
与 清单 7.11 中 lock free stack::pop O 的 对 应 代码 是 类 似 的 ， 但 是 被 修改 为 可 以 
AM external counters 计数 。 它 在 整个 count 上 使 用 单个 compare exchange 
strong () 来 处 理 两 个 计数 @， 正 如 你 在 release ref () 中 减少 internal count 
所 做 的 一 样 。 正 如 清单 7.11 — FÉ, internal count 的 值 被 更 新 了 @ ， 并 且 
external counters 的 值 减少 1@。 如 果 这 两 个 值 现在 都 为 零 ， 那么 此 结 点 就 没有 引 
用 ， 因 此 可 以 安全 删除 它 @。 这 需要 作为 一 个 操作 来 执行 (因此 需要 比较 /交换 循环 ) 
以 避免 竞争 条 件 。 如 果 分 别 更 新 这 两 个 值 ， 那 么 两 个 线程 都 可 能 认为 它们 自己 是 最 后 一 
个 线程 ， 因 此 都 删除 这 个 结 点 ， 这 就 会 导致 未 定义 的 行为 。 

尽管 这 种 方法 是 有 效 的 并 且 是 无 竞争 的 ， 但 是 它 有 性 能 问题 。 一 旦 一 个 线程 通过 成 
功 完成 old tail.ptr-»data 上 的 compare exchange strong() (如 清单 7.15 
HO 所 示 )， 开 始 执行 Push () 操作 。 此 时 没有 线程 可 以 执行 push O 操作 。 任 何 试图 
执行 push O 操作 的 线程 都 会 看 到 新 值 而 不 是 nullptr ， 这 就 使 得 compare_ 
exchange strong () 失败 并 且 使 得 线程 再 次 循环 。 这 是 一 个 忙 则 等 待 现 象 ， 会 消耗 
CPU 周期 而 没有 任何 收益 。 因 此 ， 这 是 一 个 锁 。 第 一 个 调用 push O 的 线程 阻塞 别 的 线 
程 ， 直 到 它 完成 了 操作 。 因 此 这 个 代码 不 是 无 锁 的 。 正 常情 况 下 ， 当 线程 阻塞 时 ， 操 作 
系统 可 以 给 拥有 互 斥 锁 的 线程 优先 权 。 但 是 在 这 里 操作 系统 却 无 法 给 拥有 互 斥 锁 的 线程 
优先 权 ， 因 此 阻塞 的 线程 会 一 直 消 耗 CPU 周期 直到 第 一 个 线程 完成 操作 。 这 就 需要 下 
一 个 方法 ， 等 待 的 线程 可 以 帮助 正在 执行 push () 操作 的 线程 。 


2. 通过 协助 另 一 个 线程 使 得 队列 无 锁 


为 了 使 代码 无 锁 ， 就 需要 找到 一 种 方法 使 得 即使 执行 push () 操作 的 线程 拖延 了 ， 
等 待 的 线程 依然 可 以 继续 执行 。 一 种 方法 就 是 帮助 拖延 的 线程 做 它 要 完成 的 操作 。 

在 这 种 情况 下 ， 你 清楚 地 知道 将 要 做 哪些 操作 。tail M next 指针 需要 指向 一 个 
新 的 哑 元 结 点 ， 然 后 更 新 tail 指针 。 哑 元 结 点 是 没有 区 别 的 ， 因 此 无 论 是 使 用 成 功 将 
数据 人 队列 的 线程 创造 的 哑 元 结 点 ， 还 是 使 用 等 待 将 数据 入 队列 的 线程 创造 的 哑 元 结 
点 ， 都 是 可 以 的 。 如 果 使 得 结 点 的 next 指针 成 为 原子 的 ， 就 可 以 使 用 
compare exchange strong () 来 设置 该 指针 。 一 旦 设置 好 next 指针 ， 就 可 以 在 确 
保 它 仍然 引用 同一 个 最 初 的 结 点 的 情况 下 ， 使 用 compare exchange weak () 循环 来 
设置 tail。 如 果 它 没有 引用 同一 个 最 初 的 结 点 ， 那 么 就 表示 别 的 线程 已 经 更 新 它 了 ， 
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此 时 就 停止 尝试 并 且 再 次 循环 。 这 就 需要 稍微 改变 pop () RRA next 指针 。 如 清单 
7.20 所 示 。 


清单 7.20 ”修改 pop() 来 允许 帮助 push() 


template<typename T> 
class lock free queue 
{ 
private: 
struct node 
{ 
std::atomic<T*> data; 
std::atomic«node counter» count; 
std::atomic«counted node ptr» next; 0 
Jo 
public: 
std: :unique ptr«T» pop() 
{ 
counted_node_ptr old head-head.load(std::memory order relaxed); 
for() 
{ 
increase external count (head,old head); 
node* const ptr=old_head.ptr; 
if (ptr==tail.load() .ptr) 


{ 
} 


counted node ptr next-ptr-»next.load(); -© 
if(head.compare exchange_strong(old head,next)) 


{ 


return std::unique_ptr<T>(); 


T* const res=ptr->data.exchange (nullptr) ; 
free external counter (old head); 
return std::unique ptr«T» (res); 


) 


ptr-»release ref(); 


) 
) i 

如 我 所 言 , 这 里 的 改变 是 很 简单 的 , next 指针 现在 是 原子 的 @ ,因此 @ 中 的 load 
也 是 原子 的 。 在 这 个 例子 中 , 使 用 了 默认 的 memory order seq cst 顺序 , 因此 你 可 
以 省 略 明确 调用 load () ， 并 且 依 靠 counted node ptr 的 隐 式 载 人 。 但 是 使 用 明确 
的 调用 可 以 提醒 你 稍 后 在 哪里 增加 明确 的 内 存 顺序 。 

清单 7.21 列 出 了 push () 的 更 多 代码 。 


清单 7.21 无 锁 队 列 中 使 用 帮助 的 push() 


template<typename T> 
class lock free queue 


{ 


^ 
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private: 
void set new tail(counted node ptr &old tail, 0 
counted node ptr const &new tail) 
{ 


node* const current_tail_ptr=old_tail.ptr; 
while(!tail.compare exchange weak(old tail,new tail) && 0 
old_tail.ptr==current_tail_ptr); 


if (old_tail.ptr==current_tail_ptr) -© 

free external counter(old tail); 0 
else 

current tail ptr-»release ref(); a 


) 
public: 

void push(T new value) 

{ 
std::unique_ptr<T> new_data (new T(new_value) ) ; 
counted_node_ptr new_next; 
new next.ptr-new node; 
new next.external count-1; 
counted node ptr old tail-tail.load(); 


BOM 72) 


{ 


increase_external_count (tail,old_tail) ; 


T* old_data=nullptr; 

if(old tail.ptr-»data.compare exchange strong( +@ 
old data,new data.get())) 

{ 


counted node ptr old next-(0]; 

if(!old tail.ptr-»next.compare exchange strong( 0 
old next,new next)) 

{ 


delete new next.ptr; 0 
new next-old next; 0 
) 
set new tail(old tail, new next); 
new data.release(); 
break; 
} 


else +) 
{ 


counted node ptr old_next={0}; 
if(old tail.ptr-»next.compare exchange strong( -+O 
old next,new next)) 


old next-new next; «p 
new next.ptr-new node; +® 
} 
set new tail(old tail, old next); +Q 
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这 与 清单 7.15 中 的 最 初 的 push () 是 类 似 的 , 但 是 也 有 一 些 很 重要 的 不 同 之 处 。 如 
果 你 的 确 设置 了 data 指针 @ ， 就 需要 处 理 这 样 一 种 情况 。 那 就 是 另 一 个 线程 已 经 帮助 
你 了 ， 现 在 有 一 个 else 子 句 也 在 帮助 你 @。 

已 经 设置 了 结 点 的 data 指针 ©, push O 的 新 版 本 使 用 compare exchange - 
strong () 来 更 新 next 指针 @。 使 用 compare exchange strong () 来 避免 循环 。 
如 果 交 换 失败 了 ， 就 可 以 得 知 另 一 个 线程 已 经 设置 了 next 指针 ， 因 此 就 不 再 需要 最 初 
分 配 的 新 结 点 了 ， 就 可 以 删除 它 @。 你 仍然 想 使 用 另 一 个 线程 更 新 tail 设置 的 next 
fe. 

tail 指针 的 真正 更 新 发 生 在 set new tail( 中 @。 这 就 使 用 compare 
exchange weak () 循环 @ 来 更 新 tail。 因 为 如 果 别 的 线程 试图 push () 一 个 新 结 点 ， 那 
么 external_count 的 值 就 发 生 了 改变 并 且 你 不 想 失 去 它 。 尽管 如 此 , 你 要 注意 如 果 男 一 
个 线程 已 经 成 功 改 变 了 它 ， 那 么 你 就 不 能 更 换 此 值 ， 否 则 ， 就 可 能 以 在 队列 中 循环 作为 结 
R, 而 这 不 是 一 个 好 主意 。 所 以 , 你 要 确保 如 果 比 较 /交换 失败 了 , RAMEK ptr 是 同样 的 。 
如 果 退 出 循环 时 ptr 是 同样 的 ©, 那么 你 就 必须 成 功 设置 tail, 因此 需要 释放 旧 的 外 
部 计数 @。 如 果 退 出 循环 时 ptr 是 不 一 样 的 ， 就 说 明 另 一 个 线程 将 释放 此 计数 器 ， 因 
此 你 只 需要 通过 该 线程 释放 单个 引用 e. 

如 果 线 程 调 用 push () ， 并 且 这 次 没有 成 功 通过 循环 设置 data 指针 ， 那 么 它 可 以 
帮助 成 功 的 线程 完成 更 新 。 首 先 ， 你 尝试 更 新 这 个 线程 新 分 配 结 点 的 next 指针 图 。 如 
果 成 功 了 ， 你 将 使 用 你 分 配 的 结 点 作为 新 的 tail@， 并 且 需 要 分 配 男 一 个 新 结 点 预 其 
可 以 真正 入 队列 @@。 然 后 你 就 可 以 在 再 次 循环 前 通过 调用 set new tail 来 设置 
tail®, 

你 可 能 已 经 注意 到 这 一 段 代 码 中 有 很 多 的 new 和 delete 调用 , 因为 push O 分配 
新 结 点 ， 而 pop () 销毁 结 点 。 内 存 分 配器 的 效率 在 很 大 程度 上 影响 了 这 段 代 码 的 性 能 。 
一 个 不 好 的 内 存 分 配器 可 以 完全 破坏 无 锁 容器 的 可 扩展 性 。 选 择 和 实现 该 分 配器 超出 了 
该 书 的 范围 , 但 是 请 记 住 判 别 分 配器 是 好 是 坏 的 唯一 办 法 就 是 使 用 它 并 且 测 试 使 用 它 前 
后 代码 的 性 能 。 优 化 内 存 分 配器 的 通用 办 法 包括 在 每 个 线程 上 都 有 一 个 独立 的 内 存 分 配 
器 ， 以 及 使 用 空闲 表 来 回收 结 点 而 不 是 将 它们 返回 给 分 配器 。 

已 经 举 了 很 多 例子 了 。 现 在 ， 我 们 从 这 些 例子 里 找 出 写 无 锁 数据 结构 的 一 些 准 则 。 


编写 无 锁 数据 结构 的 准则 


如 果 你 看 了 本 章 的 所 有 例子 ， 那么 你 就 会 了 解 使 无 锁 代码 正确 的 复杂 性 。 如 果 你 准 
备 设计 你 自己 的 数据 结构 ， 那 么 需要 注意 一 些 准 则 。 第 6 章 开始 部 分 提 到 的 关于 并 发 数 
据 结构 的 总 体 准 则 依然 是 适用 的 ， 但 是 你 需要 更 多 准则 。 我 将 从 这 些 例子 中 提取 出 一 些 
有 用 的 准则 ， 当 你 设计 你 自己 的 无 锁 数据 结构 时 可 以 参考 。 
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第 7 章 ”设计 无 锁 的 并 发 数据 结构 


准则 : 使 用 std::memory_order seq cst 作为 原型 


std::memory order seq cst 比 别 的 内 存 顺序 更 容易 理解 ， 因 为 所 有 操作 形成 
了 总 的 顺序 。 在 这 章 的 例子 中 ,我 们 都 是 从 std::memory order seq cst 开始 , 并 
且 一 旦 基础 操作 正确 的 情况 下 才 会 放松 内 存 顺 序 约束 。 从 这 个 意义 上 来 说 , 使 用 别 的 内 
存 顺序 是 在 优化 ， 但 是 你 要 避免 过 早 优化 。 通 常 ， 只 有 当 你 看 到 所 有 代码 对 数据 结构 核 
心 操 作 正确 的 时 候 ， 才 能 决定 哪些 操作 可 以 放松 。 过 早 地 考虑 其 他 内 存 顺序 只 会 带 来 麻 
烦 。 代 码 可 能 会 正确 工作 ,但 是 并 不 保证 是 这 样 的 。 仅 仅 跑 程序 是 不 够 的 ， 除 非 有 个 算 
法 检查 器 来 系统 测试 所 有 与 具体 顺序 保证 相符 的 可 见 线程 组 合 。 


7.3.2 准则 : 使 用 无 锁 内 存 回 收 模 式 


无 锁 代 码 最 大 的 问题 之 一 就 是 管理 内 存 。 当 别 的 线程 仍然 引用 对 象 的 时 候 就 不 能 删 
除 它们 ， 这 是 最 基本 的 。 但 是 你 仍然 想 尽 快 删除 它们 来 避免 过 多 的 内 存 消耗 。 本 章 将 介 
绍 三 种 方法 来 确保 可 以 安全 回收 内 存 。 

W 等 待 直到 没有 线程 访问 该 数据 结构 ， 并 且 删 除 所 有 等 待 删除 的 对 象 。 

Wb ”使 用 风险 指针 来 确定 线程 正在 访问 一 个 特定 的 对 象 。 

m 引用 计数 对 象 ， 只 有 直到 没有 显著 的 引用 时 才 删 除 它们 。 

在 所 有 的 情况 下 ， 关 键 的 想法 就 是 使 用 一 些 方法 来 记录 有 多 少 线程 在 访问 一 个 特定 
的 对 象 ， 并 且 只 删除 不 再 被 引用 的 对 象 。 有 很 多 方法 可 以 回收 无 锁 数 据 结构 的 内 存 。 例 
如 ， 使 用 垃圾 回收 器 是 很 理想 的 方案 。 当 你 不 再 使 用 结 点 的 时 候 ， 垃 圾 回收 期 可 以 释放 
结 点 。 在 这 种 情况 下 写 程序 就 简单 一 些 。 

另 一 个 方法 就 是 回收 结 点 ， 并 且 当 数据 结构 被 销毁 的 时 候 才 完全 释放 它们 。 因 为 结 
点 是 重复 使 用 的 ， 内 存 永远 不 会 失效 。 这 样 避免 未 定义 行为 的 困难 就 不 存在 了 。 缺点 就 
是 男 一 个 问题 变 得 更 常见 。 这 就 是 所 谓 的 ABA 问题 。 


7.3.3 准则 : 当心 ABA 问题 


ABA 问题 是 任何 基于 比较 /交换 的 算法 都 必须 提防 的 问题 。 它 是 这 样 的 。 

1 线程 1 读 取 一 个 原子 变量 x， 并 且 发 现 它 的 值 为 A。 

2 线程 1 基于 这 个 值 执行 了 一 些 操作 ， 例 如 解 引 用 它 (如 果 它 是 指针 的 话 ) 或 者 
做 一 些 查找 操作 。 

3 ”线程 1 被 操作 系统 阻塞 了 。 

4 另 一 个 线程 在 X 上 执行 了 一 些 操作 ， 将 它 的 值 改 为 B。 

5 第 三 个 线程 更 改 了 与 值 和 A 相关 的 值 ， 因 此 线程 1 持 有 的 数值 就 不 再 有 效 了 。 这 
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个 变化 有 可 能 很 大 ， 如 释放 它 所 指向 的 内 存 或 者 改变 相关 的 值 一 样 。 
6 第 三 个 线程 基于 新 值 将 x 的 值 改 回 A。 如 果 这 是 一 个 指针 ， 那 么 就 可 能 是 一 个 
新 的 对 象 ， 此 对 象 刚好 与 先前 的 对 象 使 用 了 相同 的 地 址 。 
7 线程 1 重新 取得 x, HE x 上 执行 比较 /交换 操作 ， 与 A 进行 比较 。 比 较 /交换 
操作 成 功 了 (因为 值 确实 是 和), 但 是 这 个 A 的 值 是 错误 的 第 二 步 中 读 取 的 值 
不 再 有 效 ， 但 是 线程 1 并 不 知道 ， 并 且 将 破坏 数据 机 构 。 
现在 这 里 没有 程序 遇 到 这 种 问题 ， 但 是 写 无 锁 程序 的 时 候 就 很 容易 遇 到 这 种 问题 。 
最 常用 的 避免 这 种 问题 的 方法 就 是 在 变量 x 上 使 用 一 个 ABA 计数 器 。 此 时 ，x 加 上 计 
数 器 这 样 一 个 结合 的 数据 结构 就 将 作为 一 个 单位 ， 比 较 / 交 换 就 会 基于 这 个 单位 进行 操 
作 。 每 次 修改 值 的 时 候 ， 计数器 的 值 都 会 加 一 。 即 使 x 的 值 是 一 样 的 ， 如 果 另 一 个 线程 
修改 了 x， 比 较 /交换 操作 将 会 失败 。 
使 用 空闲 表 或 者 回收 结 点 而 不 是 将 它 返 回 给 分 配器 ， 使 得 ABA 问题 在 算法 中 是 很 
常见 的 。 


7.3.4 准则 : 识别 忙于 等 待 的 循环 以 及 辅助 其 他 线程 
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在 最 后 的 队列 例子 中 , 可 以 看 出 执行 人 队 操 作 的 线程 必须 等 待 另 一 个 执行 人 队 操 作 
的 线程 完成 操作 后 才能 进行 。 更 不 用 说 ， 将 会 出 现 忙 则 等 待 循 环 ， 等 待 的 线程 不 能 继续 
执行 的 时 候 会 浪费 CPU 时 间 。 如 果 最 终 以 忙 则 等 待 循 环 结束 ， 那 么 你 事实 上 就 有 了 阻 
塞 操 作 ， 并 且 也 可 能 会 使 用 互 斥 元 和 锁 。 通 过 修改 程序 ， 如 果 安 排 等 待 中 的 线程 运行 的 
话 ， 那 么 此 线程 会 在 最 初 的 线程 完成 操作 前 继续 执行 未 完成 的 步 又。 此 时 就 可 以 消除 忙 
则 等 待 ， 并 且 操 作 不 再 被 阻塞 。 在 队列 的 例子 中 ， 这 就 需要 将 数据 成 员 变 为 原子 变量 而 
不 是 非 原 子 变量 , 并 且 使 用 比较 /交换 操作 设置 它 , 但 是 在 更 复杂 的 数据 结构 中 需要 改变 
更 多 。 


小 结 


紧 接 着 第 6 章 中 描述 的 基于 锁 的 数据 结构 , 这 一 章 描述 了 多 种 使 用 栈 或 队列 的 无 锁 
数据 结构 的 简单 实现 。 你 必须 注意 你 的 原子 操作 的 内 存 顺序 ， 确 保 没 有 数据 竞争 并 且 每 
个 线程 看 到 的 数据 结构 是 一 致 的 。 你 也 注意 到 无 锁 数据 结构 中 的 内 存 管理 比 基 于 锁 的 数 
据 结构 中 的 内 存 管理 变 得 更 难 ， 并 且 通 过 一 些 方法 来 处 理 它 。 你 也 注意 到 如 何 通过 帮助 
你 所 等 待 的 线程 完成 它 的 操作 ， 从 而 避免 创造 等 待 循环 。 

设计 无 锁 数据 结构 是 一 个 很 难 的 任务 ， 并 且 很 容易 产生 错误 ， 但 是 在 某 些 情况 下 ， 
这 种 数据 结构 有 很 好 的 可 扩展 性 。 希 望 通过 本 章 的 例子 和 准则 ， 你 可 以 设计 你 自己 的 无 
锁 数 据 结 构 ， 实 现 它 或 者 发 现 别 的 人 写 的 数据 结构 中 的 错误 。 
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如 果 多 个 线程 共享 数据 ， 那 么 就 需要 考虑 使 用 什么 数据 结构 以 及 如 何在 线程 间 
同步 此 数据 。 通 过 设计 并 发 数据 结构 ， 可 以 将 它 封装 在 数据 结构 中 ， 这 样 剩 下 来 的 
代码 就 可 以 集中 在 如 何 操作 此 数据 结构 上 而 不 是 数据 同步 上 。 在 第 8 章 中 ， 当 我 们 
从 并 发 数据 结构 转移 到 并 发 代码 上 ， 你 就 可 以 看 到 它 所 起 的 作用 了 。 并 行 算法 使 用 
多 线程 来 提高 效率 ， 当 算法 需要 多 线程 共享 数据 的 时 候 ， 选 择 使 用 何 种 并 发 数据 结 
构 就 很 重要 了 。 


前 面 的 章节 主要 是 讨论 新 的 C++11 工具 箱 里 用 来 写 并 行 代码 的 工具 。 在 第 6 章 和 第 
7 章 中 ， 我 们 观察 了 如 何 使 用 这 些 工具 来 设计 多 个 线程 可 以 并 发 存 取 的 安全 的 基础 数据 
结构 。 作 为 木匠 ,为 了 制作 柜 橱 或 者 桌子 ， 不 仅仅 需要 知道 如 何 匀 链 或 者 接 颖 处 。 同 样 ， 
需要 设计 并 行 代码 而 不 仅仅 是 设计 和 使 用 基础 数据 结构 。 你 需要 了 解 更 广泛 的 背景 ， 这 
样 就 可 以 构造 进行 有 用 工作 的 更 大 的 结构 。 我 将 使 用 一 些 C++ 标准 库 算 法 的 多 线程 实现 
作为 例子 ， 但 是 同样 的 原则 适用 于 应 用 的 所 有 方面 。 

正如 所 有 编程 项 目 一 样 ， 仔 细 考 虑 并 行 代 码 是 很 重要 的 。 尽 管 如 此 ， 使 用 多 线程 代 
码 比 使 用 顺序 代码 需要 考虑 更 多 的 因素 。 你 不 仅 需要 考虑 常见 的 因素 ， 例 如 封装 ， 耦 合 
MAR (在 很 多 软件 设计 书 中 有 详细 的 描述 ) ， 而 且 需 要 考虑 共享 哪些 数据 ， 如 何 同步 
那些 数据 的 存 取 ， 哪 个 线程 需要 等 待 哪些 别 的 线程 完成 特定 操作 ， 等 等 。 

本 章 ， 我 们 将 致力 于 这 些 问 题 ， 从 高 层次 考虑 使 用 多 少 个 线程 ， 各 个 线程 执行 哪些 
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代码 ， 以 及 这 些 是 如 何 影响 代码 的 透明 度 。 到 低层 次 考虑 如 何 构造 共享 数据 来 获得 最 佳 
性 能 。 
让 我 们 从 在 线程 间 划 分 工作 的 技术 开始 。 


81 在 线程 间 划 分 工作 的 技术 


设想 你 被 安排 建造 一 所 房子 。 为 了 完成 这 项 工作 ， 你 需要 挖 地 基 、 筑 墙 、 布 线 等 。 
理论 上 说 ， 你 可 以 在 足够 的 训练 下 全 部 自己 完成 ， 但 是 将 耗费 很 多 时 间 ， 并 且 会 一 直 切 
换 任务 。 或 者 ， 你 可 以 雇佣 别人 来 帮助 你 。 你 只 需要 选择 雇佣 多 少 人 并 且 决定 他 们 需要 
哪些 技能 。 例 如 ， 你 可 以 雇佣 一 些 具有 一 般 技能 的 人 ， 并 且 让 每 个 人 做 所 有 事 。 你 仍然 
需要 切换 任务 ， 但 是 因为 人 数 更 多 所 以 能 够 更 快 地 完成 。 

或 者 ， 你 可 以 雇佣 一 些 专家 。 例 如 ， 砖 折 ， 木 折 ， 电 工 和 管道 工 。 这 些 专家 只 做 他 
们 专长 的 事情 ， 因 此 如 果 没 有 管道 工程 的 时 候 ， 管 道 工 就 不 需要 做 任何 事情 。 事 情 会 比 
之 前 完成 得 更 快 ， 因 为 有 更 多 的 人 ， 并 且 当 电工 给 厨房 布线 的 时 候 ， 管 道 工 可 以 安装 卫 
生 间 。 但 是 当 专家 没有 工作 的 时 候 就 会 处 于 等 待 状态 。 即 使 有 空闲 时 间 ， 你 也 会 发 现 雇 
佣 专 家 比 雇佣 一 般 技能 的 人 工作 进展 得 更 快 。 专 家 不 需要 改变 工具 ， 并 且 他 们 完成 任务 
比 一 般 人 要 快 。 无 论 这 种 情况 是 否 取决 于 特殊 情况 一 一 你 都 需要 尝试 一 下 。 

即使 你 雇佣 专家 ， 你 仍然 可 以 选择 每 种 专家 的 数量 。 例 如 ， 雇 佣 比 电工 数量 更 多 的 
巷 折 就 很 合理 。 如 果 你 要 建造 不 止 一 座 房子 的 话 ， 你 的 队伍 的 构成 以 及 总 体 效 率 都 会 发 
生 改 变 。 即 使 管道 工 在 给 定 的 房子 上 不 会 有 太 多 的 工作 ， 你 也 可 以 一 次 建造 很 多 房子 ， 
这 样 他 就 会 始终 有 工作 了 。 并 且 ， 如 果 当 他 们 没有 工作 的 时 候 不 需要 付 钱 的 话 ， 那 么 就 
可 以 负担 更 大 的 团队 了 ， 即 使 同一 时 间 只 有 相同 数量 的 人 在 工作 。 

那么 线程 需要 做 哪些 呢 ? 同样 的 问题 也 适用 于 线程 。 你 需要 决定 使 用 多 少 线程 以 及 
它们 需要 完成 什么 任务 。 你 需要 决定 是 使 用 “通用 型 ”线程 来 在 需要 的 时 候 执行 操作 ， 
还 是 使 用 “专家 型 ”线程 来 做 好 一 件 事 或 一 些 合作 的 事 。 你 需要 决定 无 论 是 为 了 使 用 并 
发 性 而 划分 的 原因 ， 还 是 如 何 去 做 都 会 对 代码 的 性 能 和 清晰 度 产 生 很 大 影响 。 因 此 理解 
这 些 选 择 是 很 重要 的 ， 这 样 当 设计 你 的 应 用 中 的 数据 结构 的 时 候 ， 就 可 以 做 出 合适 的 决 
定 。 在 这 部 分 ， 我 们 将 会 看 到 一 些 划 分 任务 的 方法 。 在 我 们 做 别 的 工作 前 先 来 看 看 如 何 
在 线程 间 划 分 数据 。 


8.1.1 处 理 开 始 前 在 线程 间 划 分 数据 


最 早 并 行 化 的 算法 是 简单 的 算法 ， 如 std::for_each 在 数据 集合 中 对 每 个 元 素 
进行 操作 。 为 了 并 行 化 这 样 的 算法 ， 就 需要 将 每 个 元 素 划分 到 一 个 处 理 线程 中 。 如 何 划 
分 元 素来 得 到 最 优 性 能 在 很 大 程度 上 决定 于 数据 结构 的 细节 , 稍 后 我 们 分 析 性 能 问题 的 
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时 候 就 可 以 看 到 了 。 

划分 数据 最 简单 的 方法 就 是 将 第 一 个 N 元 素 分 配给 一 个 线程 ， 将 下 一 个 N 元 素 分 
配给 另 一 个 线程 ， 以 此 类 推 ， 正 如 图 8.1 所 示 ， 但 是 也 可 以 使 用 别 的 模式 。 无 论 如 何 划 
分 数据 ， 每 个 线程 只 能 处 理 分 配给 它 的 元 素 ， 并且 直到 它 完 成 任务 的 时 候 才 能 与 别 的 线 
程 通信 。 


sur inp isl Mo 
图 8.1 在 线程 间 划 分 连续 数据 块 

这 种 结构 与 使 用 消息 传递 接口 (Message Passing Interface, MPI) :或 者 OpenMP: 框 
架 编 程 的 结构 是 类 似 的 。 一 个 任务 被 分 成 一 个 并 行 任务 集 ， 工 作 的 线程 独立 运行 这 些 任 
务 , 并 且 在 最 后 的 化 简 步 又 中 合并 这 些 结果 。 这 是 2.4 节 中 accumulate 例子 使 用 的 方 
ik, 在 这 种 情况 下 ， 并 行 任务 和 最 后 的 步 又 都 是 累加 。 对 一 个 简单 的 for_each 来 说 ， 
最 后 的 步 又 是 不 需要 的 ， 因 为 不 需要 化 简 结 果 。 

确定 将 最 后 的 步 双 作为 化 简 步 又 是 很 重要 的 ， 清 单 2.8 中 的 简单 实现 将 执行 此 化 简 
作为 最 后 的 线性 步 又。 尽管 如 此 , 这 个 步骤 也 可 以 并 行 化 。 累加 过 程 本 身 就 是 化 简 操作 ， 
因此 可 以 修改 清单 2.8， 当 线程 的 数量 比 线程 处 理 的 的 最 少数 据 的 数量 还 要 多 ， 就 可 以 
递归 地 调用 它 本 身 。 或 者 ， 当 每 个 线程 完成 它 的 任务 后 ， 工 作 线程 可 以 执行 一 些 化 简 操 
作 步 又 ， 而 不 是 每 次 产 一 些 新 线程 。 

尽管 这 种 方法 是 很 有 效 的 ， 但 是 并 不 适用 于 所 有 情况 。 有 时 数据 不 能 被 事先 划分 ， 
因为 只 有 当 处 理 数据 的 时 候 才 知道 如 何 划分 。 在 化 简 算 法 例如 快速 排序 中 ， 这 种 情况 更 
明显 。 因 此 需要 一 个 不 同 的 方法 。 


8.1.2 ”递归 地 划分 数据 


快速 排序 算法 有 两 个 基本 步 又 , 基于 其 中 一 个 元 素 (关键 值 ) 将 数据 划分 为 两 部 分 ， 


1 http://www.mpi-forum.org/ 
2 http://www.openmp.org/ 


216 


第 8 章 设计 并 发 代码 


一 部 分 在 关键 值 之 前 ， 一 部 分 在 关键 值 之 后 。 然 后 递归 地 排序 这 两 部 分 。 你 无 法 通过 预 
先 划 分 数据 来 实行 并 行 ， 因 为 只 有 当 处 理 元 素 的 时 候 才 知道 他 们 属于 哪 一 个 “部 分 ”。 
如 果 你 打算 并 行 这 个 算法 ， 就 需要 把 握 递 归 的 本 质 。 每 次 递归 的 时 候 ， 会 调用 更 多 的 
quick sort 函数 来 排序 关键 点 之 前 和 关键 点 之 后 的 元 素 。 这些 递 归 调 用 是 完全 相互 独 
立 的 ， 因 为 它们 读 取 完全 不 同 的 元 素 集合 。 这 种 划分 可 以 作为 我 们 初步 的 候选 方案 。 此 
递归 划分 如 图 8.2 所 示 。 


LLLLLLLETTTTTTTIIITTTTTTTTTTIIITITÀ 


图 8.2 连续 划分 数据 


在 第 4 章 中 ， 有 这 样 一 个 实现 。 不 仅 只 是 为 这 两 部 分 执行 两 个 递归 调用 ， 你 还 在 每 
一 步 都 在 前 一 部 分 使 用 std: :async () 来 生成 异步 任务 。 通 过 使 用 std: :async () ， 
你 让 C++ 线程 库 来 决定 何 时 在 一 个 新 线程 上 运行 这 个 任务 ， 以 及 何 时 同步 运行 它们 。 

当 你 对 很 大 规模 的 数据 进行 排序 的 时 候 这 是 很 重要 的 。 为 每 一 个 递归 调用 生成 一 个 
新 线程 会 很 快 产生 大 量 线程 。 当 我 们 考虑 性 能 的 时 候 , 你 就 会 发 现 如 果 线 程 太 多 的 时 候 ， 
就 可 能 降低 了 应 用 。 如 果 数 据 集 很 大 的 时 候 也 可 能 会 用 完 所 有 的 线程 。 像 这 样 用 递归 来 
划分 总 体 任务 的 方法 是 很 好 的 ， 只 需要 严格 控制 线程 数量 就 可 以 了 。 在 简单 情况 下 ， 
std::asyne( ) 就 可 以 处 理 它 ， 但 是 这 并 不 是 唯一 选择 。 

或 者 使 用 std: :thread: :hardware concurrency () 函数 来 选择 线程 数量 , E 
如 清单 2.8 中 accumulate () 的 并 行 版 本 所 做 的 一 样 。 然 后 ， 你 只 是 将 此 块 存储 到 第 6 
章 和 第 7 章 描 述 线程 安全 栈 中 , 而 不 是 为 递归 调用 创建 一 个 新 线程 。 如果 线 程 不 在 工作 ， 
就 说 明 它 已 经 处 理 完 所 有 块 ， 或 者 等 待 存储 在 栈 中 的 块 。 此 时 可 以 从 栈 中 得 到 一 个 块 并 
将 它 排序 。 

清单 8.1 列 出 了 使 用 这 种 方法 的 简单 实现 。 


清单 8.1 使 用 待 排序 块 栈 的 并 行 快速 排序 


template<typename T» 


struct sorter «9 
{ 
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struct chunk to sort 


{ 


std::list<T> data; 
std: :promise<std::list<T> > promise; 


W 


thread_safe_stack<chunk_to_sort> chunks; +O 
Std::vector«std::thread» threads; -© 
unsigned const max thread count; 

Std::atomic«bool» end of data; 


sorter(): 
max thread count(std::thread::hardware concurrency()-1), 
end of data(false) 


{} 


~sorter () 0 
{ 
end_of_data=true; +@ 


for (unsigned i=0;i<threads.size() ;++1i) 


{ 
} 


threads [i] .join(); +@ 


} 


void try_sort_chunk () 


{ 


boost::shared ptr«chunk to sort > chunk=chunks.pop() ; +@ 
if (chunk) 
{ 
sort_chunk (chunk) ; 0 
} 
} 
std::list<T> do sort(std::list«T»& chunk data) 0 


if (chunk_data.empty () ) 


{ 
} 


std::list<T> result; 
result.splice (result .begin() , chunk_data,chunk_data.begin()); 
T const& partition_val=*result .begin() ; 


return chunk_data; 


typename std::list<T>::iterator divide_point= +O 
std::partition(chunk data.begin(),chunk data.end(), 
[&] (T const& val) {return val«partition val;])); 


chunk to sort new lower chunk; 

new lower chunk.data.splice(new lower chunk.data.end(), 
chunk data,chunk data.begin(), 
divide point); 


std::future«std::list«T» » new lower- 
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new lower chunk.promise.get future(); 
chunks.push(std::move(new lower chunk)); -+ 
if(threads.size()«max thread count) «p 


{ 
} 


std::list<T> new higher(do sort(chunk data)); 


threads.push back(std::thread(&sorter«T»::sort thread,this)); 


result.splice(result.end(),new higher); 

while(new lower.wait for(std::chrono::seconds(0)) !- 
Std::future status::ready) 

| E 


) 


result.splice(result.begin(),new lower.get()); 
return result; 


try sort chunk(); «D 


} 


void sort chunk(boost::shared ptr«chunk to sort > const& chunk) 


{ 
} 


void sort thread() 


{ 


chunk- >promise.set_value (do sort (chunk->data) ) ; -© 


while(!end of data) < 

{ 
try sort chunk(); < 
Std::this thread::yield(); +Q 


} 
m 
template<typename T» 
Std::list«T» parallel quick sort(std::list«T» input) «-D 


{ 


if (input .empty () ) 


{ 
} 


sorter<T> s; 


return input; 


return s.do_sort (input) ; <A 


ixH, parallel quick sort 函数 @ 思 代表 了 sorter KO 的 大 部 分 功能 ， 提 供 
了 一 种 简单 的 方法 将 未 排序 块 @ 所 在 的 栈 进行 分 组 ， 以 及 将 线程 集 0 分 组 。 主 要 的 工 
作 是 在 do sort 成 员 函 数 @ 中 完成 的 ， 它 是 用 来 完成 通常 的 数据 排序 @E。 这 次 ， 它 将 
块 压 和 人 栈 中 国 ， 而 不 是 为 一 个 块 产生 一 个 新 的 线程 ， 并 且 当 你 仍然 有 处 理 器 可 以 分 配 的 
时 候 就 产生 一 个 新 进程 @。 因 为 后 一 部 分 可 能 是 被 另 一 个 线程 处 理 ， 你 就 必须 等 待 它 处 
理 完成 @。 为 了 处 理 这 种 情况 〈 即 只 有 一 个 线程 或 者 别 的 线程 都 在 工作 ) ， 你 就 试图 在 等 
待 的 时 候 , 让 这 个 线程 处 理 栈 中 的 块 四 ,try_sort_chunk 只 是 将 一 个 块 出 栈 @ 并 且 将 
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它 排序 @， 将 结果 存储 在 Promise 中 ， 此 结果 可 以 被 将 此 块 放 人 栈 中 的 线程 取得 @。 

当 未 设置 send_ of data 标志 的 时 候 @， 可 以 在 循环 中 产生 线程 将 栈 中 的 块 先 出 栈 
然后 排序 @@。 在 检查 的 时 候 ， 它 们 让 别 的 线程 先 对 栈 进 行 操作 。 这 段 代 码 依靠 sorter 
类 析 构 函数 @ 来 结束 这 些 线程 。 当 所 有 数据 都 被 排序 了 ， 就 会 返回 do sort (MER 
程 仍然 在 运行 )， 因 此 主线 程 将 从 parallel quici sort 团 中 返回 ， 并 且 销 毁 你 的 
sorter 对 象 。 这 就 设置 了 end of data 标志 位 @ 并 且 等 待 线程 结 束 @。 设 置 标 志 位 
结束 了 线程 函数 中 的 循环 @。 

使 用 这 种 方法 就 不 会 和 使 用 spawn_task 来 产生 一 个 新 线程 一 样 导致 无 穷 多 个 线 
程 这 样 的 问题 了 ， 并 且 不 再 和 std: :async O 一样 依赖 C++ 线程 库 来 选择 线程 数量 。 
现在 我 们 将 线程 数量 限制 到 std::thread::hardware concurrency () 来 避免 过 
多 的 任务 切换 。 尽管 如 此 ， 你 有 另 一 个 潜在 的 问题 ， 处 理 这 些 线程 和 线程 间 通 信 给 代码 
增加 了 很 多 复杂 性 。 同 时 ， 尽 管 这 些 线程 在 处 理 不 相关 的 数据 元 素 ， 它 们 都 访问 栈 来 移 
入 和 移出 所 操作 的 块 。 即 使 使 用 无 锁 (因此 是 无 阻塞 的 ) 栈 ， 这 种 竞争 会 降低 性 能 。 你 
稍 后 会 看 到 原因 。 

这 种 方法 是 一 种 特殊 版 本 的 线程 池 一 一 有 一 个 线程 集 , 每 个 线程 处 理 等 待 列表 中 的 
工作 ， 然 后 回 到 线程 池 。 线 程 池 存 在 的 问题 (包括 列表 上 的 竞争 )， 第 9 章 中 有 解决 这 
些 问题 的 方法 。 本 章 稍 后 将 讨论 如 何 将 程序 扩展 到 多 处 理 器 上 执行 (参见 8.2.1 节 )。 

在 处 理 开始 前 划分 数据 和 递归 划分 数据 都 是 假设 数据 是 固定 不 变 的 ， 然 后 你 寻找 划 
分 它 的 方法 ， 但 是 情况 并 不 总 是 这 样 。 如 果 数 据 是 动态 生成 的 或 者 是 外 部 输入 的 ， 那 么 
这 种 方法 就 不 行 了 。 在 这 种 情况 下 ， 通 过 任务 类 型 来 划分 工作 比 基 于 数据 划分 更 合适 。 


8.1.3 ”以 任务 类 型 划分 工作 


通过 给 每 个 线程 分 配 不 同 数据 块 在 线程 间 划 分 工作 (无 论 是 事先 划分 还 是 处 理 过 程 
中 递归 划分 ) 仍然 是 基于 这 样 的 假设 ， 即 线程 将 会 基于 每 个 数据 块 做 同样 的 工作 。 划 分 
工作 的 另 一 种 方法 是 使 得 线程 变 得 专业 化 ， 即 每 个 线程 执行 不 同 的 任务 ,就 如 同 建造 房 
子 的 时 候 管道 工 和 电工 执行 不 同 的 任务 一 样 。 线 程 可 以 基于 也 可 以 不 基于 同样 的 数据 来 
工作 ， 但 是 如 果 基 于 同样 的 数据 ， 那 也 是 有 不 同 的 目的 。 

这 种 划分 工作 的 方式 源 自 于 将 并 发 中 的 关注 点 分 离 。 每 个 线程 都 有 不 同 的 任务 ， 并 
且 独 立 于 别 的 线程 来 工作 。 偶 尔 别 的 线程 可 能 给 它 数据 或 者 有 触发 事件 需要 处 理 ， 但 是 
通常 每 个 线程 只 做 一 件 事情 。 这 本 质 上 是 一 个 好 设计 ， 每 块 任务 都 应 该 只 负责 一 个 单一 
的 任务 。 


1. 以 任务 类 型 划分 工作 来 分 离 关 注 点 


当 在 一 段 时 间 内 需要 持续 运行 多 个 任务 的 时 候 ， 或 者 需要 此 应 用 能 够 及 时 处 理 
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有 输入 的 事件 〈 例 如 用 户 键盘 输入 或 者 输入 网 络 数据 ) 而 不 影响 别 的 线程 继续 执行 
的 时 候 ， 单 线程 应 用 需要 处 理 与 单一 任务 原则 间 的 矛盾 。 在 单线 程 环境 中 ， 你 手工 
写 代 码 来 执行 任务 A 的 一 部 分 ， 执 行 任务 B 的 一 部 分 ， 检 查 键 盘 输 入 ， 检 查 输入 的 
网 络 包 ， 然 后 继续 循环 执行 A 的 另 一 部 分 。 这 就 意味 着 任务 A 代码 的 结束 部 分 会 变 
复杂 ， 因 为 需要 保留 它 的 状态 以 及 周期 性 地 返回 控制 给 主 循环 。 如 果 你 给 循环 增加 
了 太 多 任务 ， 运 行 就 会 变 得 很 慢 ， 并 且 使 用 者 会 发 现 键盘 输入 的 响应 时 间 太 长 。 你 
肯定 见 过 一 些 应 用 采取 过 极端 的 方式 。 你 设置 它 处 理 一 些 任务 ， 然 后 接口 保持 不 变 
直到 它 完 成 任务 。 

这 就 是 线程 发 生 作用 的 地 方 。 如 果 你 在 独立 的 线程 里 运行 每 个 任务 ， 操 作 系统 
就 可 以 帮 你 处 理 这 种 问题 。 在 任务 A 的 代码 中 ， 你 可 以 致力 于 执行 任务 ， 并 且 不 需 
要 担心 保留 状态 以 及 返回 到 主 循环 或 者 在 此 之 前 你 花费 了 多 长 时 间 。 操 作 系 统 将 自 
动 地 保留 状态 ， 然 后 在 适当 的 时 候 切 换 到 任务 B 或 C， 并 且 如 果 系 统 有 多 个 核 或 者 
处 理 器 ， 任务 A 和 B 就 可 以 真正 地 并 行 运行 。 处 理 键盘 输入 或 者 网 络 包 的 代码 将 会 
运行 得 很 及 时 ， 并 且 皆 大 欢喜 。 使 用 者 获得 及 时 响应 ， 你 作为 开发 者 可 以 写 更 简单 
的 代码 ， 因 为 每 个 线程 都 致力 于 做 与 任务 直接 相关 的 操作 ， 而 不 是 与 控制 流 和 用 户 
互动 混合 在 一 起 。 

看 上 去 这 是 一 个 很 好 的 版 本 。 它 真 的 如 此 吗 ? 如 同 任何 事情 一 样 ， 它 取决 于 细节 。 
如 果 每 件 事情 都 是 独立 的 , 并 且 线程 不 需要 与 另 一 个 线程 通信 ，, 那么 它 就 确实 很 简单 了 。 
可 是 ， 事 实 却 并 不 是 如 此 。 这 些 后 台 任 务 经 常 做 一 些 用 户 需 要 的 事情 ， 并 且 它 们 需要 更 
新 用 户 接口 让 用 户 知道 是 何 时 完成 这 些 任 务 的 。 或 者 ， 用 户 可 能 要 取消 任务 ， 这 就 会 要 
求 用 户 接口 以 某 种 方式 给 后 台 任务 发 送 一 个 消息 通知 它 停止 此 任务 。 这 两 种 情况 都 需要 
仔细 的 思考 ， 设 计 以 及 适当 的 同步 。 但 是 这 些 关 注 点 都 是 分 离 的 。 用 户 接口 线程 仍然 只 
是 处 理 用 户 接口 ， 但 是 当 别 的 线程 要 求 时 ， 它 需要 更 新 它 的 接口 。 同 样 ， 运 行 后 台 任务 
的 线程 仍然 致力 于 那个 任务 要 求 的 操作 ， 只 有 当 它 的 操作 是 “允许 另 一 个 线程 停止 此 任 
务 。 在 这 两 个 例子 中 ， 线 程 都 不 关心 该 要 求 是 从 哪里 产生 的 ， 只 关心 它 是 否 是 为 它们 
准备 的 以 及 与 它们 的 任务 是 否 直接 相关 。 

多 个 线程 关键 点 分 离 有 两 个 危害 。 首 先 就 是 你 将 分 离 错误 的 关键 点 。 征 兆 就 是 线程 
间 有 很 多 共享 数据 ， 或 者 不 同 的 线程 都 以 等 待 彼此 作为 结束 。 这 两 种 情况 都 可 以 归结 为 
线程 间 有 太 多 的 通信 。 如 果 发 生 这 种 情况 ， 就 值得 查找 产生 通信 原因 。 如 果 所 有 的 通信 
都 与 同一 件 事 相关 ， 那 么 可 能 那 就 是 单线 程 的 关键 任务 ， 并 且 从 所 有 引用 它 的 线程 中 获 
得 。 或 者 ， 如 果 两 个 线程 彼此 之 间 需 要 很 多 通信 但 是 与 别 的 线程 通信 很 少 ， 那 么 它们 就 
应 该 联合 为 一 个 线程 。 

当 根 据 任务 类 型 在 线程 间 划 分 工作 的 时 候 ， 你 就 不 需要 局 限于 完全 独立 的 任务 。 如 
果 多 个 数据 集合 需要 应 用 同样 的 操作 序列 ,那么 就 可 以 划分 工作 使 每 个 线程 执行 整个 序 
列 中 一 个 步骤 。 
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2. 划分 线程 间 的 任务 序列 


如 果 你 的 任务 是 由 在 很 多 独立 数据 项 上 运行 同样 的 操作 序列 组 成 的 话 , 就 可 以 使 用 
管道 来 开发 系统 可 能 的 并 发 性 。 可 以 将 它 类 比 为 管道 ， 数 据 通过 一 系列 操作 (管子 ) 从 
一 端 流入 ， 并 且 从 另 一 端 流出 。 

为 了 用 这 种 方式 划分 工作 ,你 在 管道 的 每 一 个 步 又 都 创造 一 个 独立 的 线程 一 序列 
中 的 每 个 操作 都 有 一 个 线程 。 当 操作 完成 时 , 数据 元 素 被 放 人 队列 中 供 下 一 个 线程 获得 。 
这 就 允许 当 管 道中 第 二 个 线程 在 操作 第 一 个 元 素 的 时 候 ， 第 一 个 线程 执行 序列 中 的 第 一 
个 操作 来 开始 下 一 个 数据 元 素 。 

这 是 仅仅 在 线程 间 划 分 数据 的 一 种 替代 方法 ， 正 如 8.1.1 节 中 描述 的 一 样 ， 并 且 在 
操作 开始 时 并 不 知道 所 有 输入 数据 的 情况 下 是 适用 的 。 例 如 ， 数 据 可 能 是 通过 网 络 输入 
的 ， 或 者 序列 的 第 一 个 操作 就 是 扫描 一 个 文件 系统 来 识别 要 处 理 的 文件 。 

当 序列 中 的 每 个 操作 都 消耗 时 间 的 时 候 ， 管 道 也 可 以 很 好 地 工作 。 通 过 在 线程 
间 划 分 任务 而 不 是 数据 ， 你 改变 了 性 能 概况 。 假 设 你 要 在 四 核 上 处 理 20 个 数据 项 ， 
并 且 每 个 数据 项 需要 四 个 步 又 , 每 个 步 双 需要 3 秒 。 如 果 你 在 四 个 线程 中 划分 数据 ， 
那么 每 个 线程 要 处 理 5 个 数据 项 。 假 设 没有 别 的 影响 时 间 的 处 理 ，12 秒 后 将 处 理 完 
4 个 数据 项 ，24 秒 后 将 处 理 完 8 个 数据 项 ， 以 此 类 推 。1 分 钟 后 将 处 理 完 所 有 的 20 
个 数据 项 。 如 果 使 用 管道 ， 事 情 就 会 不 一 样 了 。 可 以 将 四 个 步 又 中 的 每 个 步 又 分 配 
到 一 个 处 理 核 上 。 现 在 每 个 核心 都 要 处 理 第 一 个 元 素 ， 因 此 需要 12 秒 。 实 际 上 ， 
12 秒 后 你 只 处 理 完 一 个 数据 项 ， 这 就 没有 比 数据 划分 的 方法 好 。 但 是 ， 一 旦 管道 
被 使 用 ， 处 理事 情 就 会 变 得 不 一 样 了 。 在 第 一 个 核心 处 理 完 的 第 一 项 以 后 ， 它 接着 
处 理 第 二 项 。 因 此 一 旦 最 后 一 个 核 处 理 完 第 一 项 ， 它 就 可 以 在 第 二 项 上 执行 它 的 步 
又。 现在 每 3 秒 都 可 以 处 理 完 一 个 数据 项 ， 而 不 是 在 每 12 秒 能 处 理 完 一 批 四 个 数 
据 项 。 

处 理 整个 分 批 会 花费 更 长 的 时 间 ， 因 为 在 最 后 一 个 核 开 始 处 理 第 一 个 数据 项 之 前 你 
需要 等 待 9 秒 。 但 是 更 平滑 ， 更 有 规律 的 处 理 在 某 些 环境 下 可 能 会 很 有 效 。 例 如 ， 考 虑 
用 来 收看 高 清 数字 电视 的 系统 。 为 了 使 电视 是 可 看 的 ， 你 至 少 需要 每 秒 25 WIT ARs 
的 帧 得 到 更 理想 的 效果 。 同 样 ， 观 看 者 需要 它们 被 均匀 地 分 开 来 得 到 持续 活动 的 印象 ; 
一 个 可 以 每 秒 解码 100 帧 的 应 用 是 没 用 的 ， 如 果 它 暂停 一 秒 ， 然 后 显示 100 帧 ， 然 后 再 
停 一 秒 ， 然 后 显示 另 一 个 100 帧 ， 另 一 方面 ， 观 看 者 可 能 很 高 兴 接 受 当 他 们 开始 观看 电 
视 的 时 候 有 几 秒 的 延迟 。 在 这 种 情况 下 ， 使 用 管道 以 一 个 更 好 、 更 稳定 的 速度 并 行 输出 
帧 可 能 会 更 好 。 

已 经 看 过 在 线程 间 划分 工作 的 一 些 方法 ， 我 们 来 看 看 影响 多 线程 系统 性 能 的 因素 以 
及 它 是 如 何 影响 你 选择 的 方法 的 。 
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8.2 ”影响 并 发 代码 性 能 的 因素 


8.2.1 


如 果 要 用 并 发 来 提高 程序 在 多 处 理 器 环境 下 的 性 能 ， 我 们 需要 了 解 哪些 因素 会 影 
响 。 哪 怕 你 只 是 用 多 线程 来 进行 关注 点 分 离 ， 你 需要 确保 这 不 会 对 性 能 有 负面 影响 。 
如 果 你 的 程序 在 16 核 的 机 器 上 跑 得 比 在 一 台 老 的 单 核 机 器 上 还 更 慢 , 客户 可 是 不 会 买 
账 的 。 

接 下 来 , 我 们 会 看 到 有 非常 多 的 因素 影响 多 线程 程序 的 性 能 一 一 哪怕 只 是 改变 下 每 
个 线程 处 理 的 哪 部 分 数据 (其 他 都 保持 不 变 ) 都 会 对 性 能 有 巨大 的 影响 。 我 们 先 不 进 一 
步 展 开 ， 从 看 其 中 一 些 明 显 的 因素 看 起 ， 如 你 的 目标 机 器 有 多 少 个 处 理 器 ? 


有 多 少 个 处 理 器 ? 


人 处理 器 的 数量 和 结构 是 多 线程 程序 的 性 能 的 首要 和 关键 的 因素 。 有 时 你 在 开发 时 是 
知道 目标 硬件 ， 有 目标 硬件 的 规格 甚至 在 一 样 的 硬件 上 开发 。 有 这 种 条 件 你 算得 上 是 幸 
运 儿 了 ， 但 是 一 般 情 况 我 们 没 这 种 待遇 。 也 许 你 是 在 相似 的 硬件 环境 下 开发 ， 但 是 其 中 
的 差异 会 很 致命 。 例 如 ， 你 在 2 核 或 4 核 的 系统 下 开发 ， 而 你 的 客户 可 能 有 多 核 处 理 器 
或 者 多 个 单 核 处 理 器 ， 乃 至 多 个 多 核 处 理 器 。 并 发 程序 的 行为 和 性 能 在 这 样 不 同 的 环境 
下 会 有 很 大 的 差异 。 因 此 你 需要 仔细 考量 会 有 哪些 影响 并 尽 可 能 地 进行 测试 。 

简单 近似 的 话 ， 一 个 16 核 处 理 器 等 价 于 4 个 4 核 处 理 器 或 16 个 单 核 处 理 器 ， 因 为 
它们 都 可 以 并 发 执行 16 个 线程 。 你 的 程序 至 少 要 有 16 个 线程 来 利用 好 这 些 硬件 。 如 果 
少 于 16， 就 会 有 处 理 器 性 能 闲置 《除非 这 个 机 器 还 在 运行 其 他 程序 ,我 们 现在 忽略 这 个 
情形 )， 另 一 方面 ， 如 果 你 有 多 于 16 个 线程 要 运行 (没有 阻塞 或 等 待 )， 会 浪费 处 理 器 
的 运算 力 在 切换 这 些 线程 上 (参见 第 1 章 )。 这 种 情况 一 般 被 称 为 过 度 订 阅 
Coversubscription), 

为 了 让 程序 中 的 线程 数量 随 着 硬件 能 同时 运行 的 线程 数量 扩展 ，C++11 的 标准 库 提 
HET std: :thread: :hardware_concurrency() 。 我 们 已 经 看 过 使 用 它 的 例子 。 

直接 调用 std::thread::hardware concurrency () 时 需要 注意 , 你 的 程序 并 
没有 考虑 机 器 上 运行 的 其 他 线程 ， 除 非 你 显 式 地 共享 这 些 信息 。 最 坏 的 情况 是 ， 多 个 线 
程 同时 调用 std::thread::hardware concurrency () 会 造成 严重 的 过 度 订 阅 。 而 
std: :async () 会 在 被 调用 时 ,由 标准 库 处 理 所 有 这 些 调用 并 适当 地 调度 ， 从 而 避免 这 
个 问题 。 精 心 设计 的 线程 池 也 能 避免 这 个 问题 。 

即使 你 已 经 考虑 了 程序 中 所 有 运行 的 线程 ， 你 仍然 会 被 其 他 同时 运行 的 程序 影响 。 
尽管 在 单 用 户 环境 下 很 少 有 多 个 CPU 密集 型 任务 同时 运行 ， 在 某 些 场景 下 这 种 情况 会 
更 普遍 。 为 这 种 应 用 场景 设计 的 系统 一 般 会 提供 某 种 机 制 来 让 程序 选择 合适 的 线程 数 ， 
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当然 这 已 经 不 在 C++ 标准 内 了 。 一 种 方法 是 提供 类 似 std::async () 的 调用 ， 在 选择 
线程 数量 时 考量 所 有 程序 异步 执行 的 任务 数量 。 另 一 种 是 限制 给 定 程序 使 用 的 核 的 数 
量 。 我 希望 在 这 样 的 平台 上 可 以 用 std::thread::hardware concurrency () 来 返 
回 这 个 数量 ， 不 过 这 取决 于 具体 的 系统 。 如 果 你 需要 处 理 这 样 的 情形 ， 可 以 去 查阅 文档 
了 解 目标 系统 提供 了 哪 种 方案 。 

这 种 情况 下 随 之 而 来 的 麻烦 是 : 一 个 问题 的 理想 算法 取决 于 问题 大 小 和 处 理 单元 的 
数量 。 如 果 你 在 有 大 量 处 理 单元 的 大 规模 并 行 处 理 机 上 运行 ， 耗 费 操 作 多 的 算法 可 能 会 
比 操作 少 的 算法 快 得 多 ， 因 为 每 个 处 理 器 只 需要 处 理 少量 的 操作 。 

随 着 处 理 器 数量 增加 ， 另 一 个 影响 性 能 的 问题 也 出 现 了 ， 多 个 处 理 器 访问 相同 的 
数据 。 


8.2.2 ”数据 竞争 和 乒乓 缓存 


如 果 两 个 线程 同时 在 不 同 的 处 理 器 上 运行 ,它们 同时 读 取 同 样 的 数据 通常 不 会 有 问 
题 ， 数 据 会 被 复制 到 各 自 的 缓存 ， 两 个 处 理 器 都 可 以 继续 执行 。 但 是 ， 如 果 其 中 一 个 线 
程 修改 了 数据 ， 这 个 修改 需要 花费 时 间 传 播 到 另 一 个 处 理 器 的 缓存 。 取 决 于 两 个 线程 的 
操作 和 这 些 操作 的 内 存 顺 序 ,， 这 样 的 修改 可 能 导致 第 二 个 处 理 器 停 下 来 等 待 内 存 硬件 传 
播 对 数据 的 修改 。 从 CPU 指令 来 说 ， 这 是 个 相当 于 数 百 条 指令 的 显著 缓慢 的 操作 ， 具 
体 的 时 间 主 要 与 硬件 的 物理 结构 相关 。 

考虑 下 面 这 段 简单 代码 。 
std::atomic«unsigned long» counter (0); 


void processing loop() 


while(counter.fetch add(1,std::memory order relaxed)«100000000) 


{ 
} 


do something(); 


) 


这 里 的 counter 是 全 局 的 , 每 个 调用 processing loop () 的 线程 都 在 修改 同一 
个 变量 。 因 此 ， 每 次 在 增加 时 ， 处 理 器 必须 保证 它 的 缓存 中 有 counter 的 最 新 拷贝 、 
修改 , 然后 发 布 到 其 他 处 理 器 。 即 使 你 用 std: memory order relaxed 来 让 编译 器 
不 同步 其 他 数据 ,，fetch_add 是 一 个 “ 读 -修改 - 写 ” 操作 , 因此 需要 获取 变量 最 新 的 值 。 
如 果 其 他 处 理 器 上 的 其 他 线程 在 运行 同样 的 代码 ，countez 的 数据 就 必须 在 两 个 处 理 
器 之 间 来 回 传 递 来 保证 每 个 处 理 器 在 增加 时 都 有 最 新 的 counter 值 。 如 果 
do something () 耗 时 很 少 , 或 者 有 太 多 的 处 理 器 在 运行 这 段 代码 ， 处 理 器 可 能 会 处 于 
互相 等 待 的 状态 。 一 个 处 理 器 已 经 准备 好 更 新 这 个 值 ， 但 是 另 一 个 处 理 器 已 经 在 做 了 ， 
这 就 要 等 待 另 一 个 处 理 器 更 新 ， 并 且 这 个 改动 已 经 传播 完成 ， 这 种 情况 被 称 为 高 竞争 
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(high contention )。 如 果 处 理 器 很 少 需要 互相 等 待 ， 则 称 为 低 竞争 〈low contention), 

在 这 样 的 循环 中 ，counter 的 数据 在 各 处 理 器 的 缓存 间 来 回 传递 。 这 被 称 为 乒乓 
缓存 〈cache ping-pong)， 而 且 会 严重 影响 程序 的 性 能 。 如 果 处 理 器 因为 需要 等 待 缓存 
而 被 挂 起， 在 这 个 时 间 里 处 理 器 无 法 进行 任何 工作 ， 即 使 有 其 他 线程 等 待 被 执行 ， 这 对 
整个 程序 来 说 不 是 个 好 消息 。 

也 许 你 会 觉得 这 不 会 在 自己 身上 发 生 ， 因 为 不 会 写 这 样 的 循环 。 但 是 你 能 确定 吗 ? 
如 互 斥 锁 ， 如 果 你 在 一 个 循环 中 获得 一 个 互 斥 元 ， 你 的 代码 从 数据 访问 的 角度 看 和 上 面 
的 代码 会 非常 相像 。 为 了 锁 住 互 斥 元 ， 另 一 个 线程 必须 从 它 所 在 的 处 理 器 获得 互 斥 元 并 
修改 。 当 操作 完成 后 ， 它 又 修改 互 斥 元 来 释放 ， 相 关 的 数据 必须 传递 到 下 一 个 需要 互 斥 
元 的 线程 所 在 的 处 理 器 。 这 个 传递 所 需 的 时 间 是 第 二 个 线程 等 待 第 一 个 线程 释放 互 斥 元 
的 额外 时 间 。 


std::mutex m; 
my data data; 
void processing loop with mutex() 


{ 


while (true) 
{ 
std::lock_guard<std::mutex> 1k(m) ; 
if (done_processing(data)) break; 
} 
} 


SLE ORE HRD: 如 果 数 据 和 互 斥 元 被 不 止 一 个 线程 访问 ， 当 你 添加 更 多 的 核 
和 处 理 器 时 ， 你 就 越 可 能 面临 高 竞争 ， 处 理 器 需要 等 待 另 一 个 处 理 器 。 如 果 你 更 快 地 用 
多 线程 来 处 理 同样 的 数据 ， 这 些 线 程 会 竞争 这 些 数据 ， 并 竞争 同一 个 互 斥 元 。 线 程 数量 
越 多 ， 就 越 可 能 同时 试图 获取 互 斥 元 或 者 访问 某 个 原子 变量 。 

竞争 互 斥 元 的 影响 通常 和 竞争 原子 操作 不 同 ， 因 为 使 用 互 斥 元 在 操作 系统 层面 将 线 
程 串 行 化 ， 而 不 是 在 处 理 器 层面 。 如 果 你 有 足够 的 线程 等 待 运行 ， 操 作 系统 会 在 一 个 线 
程 等 待 互 斥 元 时 调度 另 一 个 线程 运行 。 与 之 相对 的 是 ， 处 理 器 的 挂 起 会 阻止 其 他 线程 在 
这 个 处 理 器 上 运行 。 但 是 ， 这 仍然 会 影响 其 他 竞争 这 个 互 斥 元 的 线程 的 性 能 ， 因 为 它们 
每 次 只 有 一 个 会 被 运行 。 

在 第 3 章 ， 我 们 看 过 如 何 用 一 个 单 写 人 者 ， 多 读 取 者 的 互 斥 元 保护 很 少 更 新 的 数据 
结构 的 例子 (参见 3.3.2 节 )。 乒 乓 缓存 会 使 得 只 用 一 个 互 斥 元 的 好 处 不 明显 ， 特 别 是 工 
作 量 大 的 时 候 。 因 为 所 有 访问 数据 的 线程 (其 至 是 读 取 者 仍然 需要 自己 去 修改 互 斥 元 。 
随 着 访问 数据 的 处 理 器 数量 上 升 ， 互 斥 元 本 身 的 竞争 也 在 增加 ， 包 含 互 斥 元 的 缓存 线 必 
须 在 各 个 核 之 间 传递 ， 导 致 获取 和 释放 锁 的 时 间 不 可 接受 。 你 可 以 用 一 些 方法 来 改善 ， 
主要 是 通过 将 互 斥 元 分 布 在 多 个 缓存 线 ， 但 这 就 意味 着 你 要 自己 去 实现 这 样 的 互 斥 元 ， 
而 不 能 使 用 系统 本 身 提供 的 。 

如 果 乒 乓 缓存 效应 有 害 ， 我 们 如 何 避 免 呢 ? 本 章 稍 后 会 揭示 ， 解 决 方法 依赖 于 提高 
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并 发 度 ， 尽 可 能 地 避免 两 个 线程 竞争 从 一 个 内 存 位 置 。 不 过 这 并 不 容易 做 到 ， 即 使 一 个 
特定 内 存 区 域 具 有 一 个 线程 会 去 访问 ， 你 仍然 会 遇 到 乒乓 缓存 ， 因 为 存在 假 共 享 (false 
sharing) 的 问题 。 


8.2.8 RHF 


处 理 器 缓存 的 最 小 单位 通常 不 是 一 个 内 存 地 址 , 而 是 一 小 块 称 为 缓存 线 (cache line) 
的 内 存 。 这 些 内 存 块 一 般 大 小 为 32 一 64 字 节 ， 取 决 于 具体 的 处 理 器 。 缓 存 只 能 处 理 组 
存 线 大 小 的 内 存 块 ， 相 邻 地 址 的 数据 会 被 载 人 同一 个 缓存 线 。 有 时 这 是 好 事 ， 线 程 访问 
的 数据 在 同一 个 缓存 线 比分 布 在 多 个 缓存 线 更 好 。 但 是 如 果 缓 存 线 内 有 不 相关 但 需要 被 
别 的 线程 访问 的 数据 ， 会 导致 严重 的 性 能 问题 。 

假设 你 有 一 个 int 型 的 数组 以 及 一 组 线程 ,每 个 线程 都 不 停 访问 和 改写 数组 中 彼此 
正 交 的 部 分 。 因 为 整 型 的 大 小 通常 小 于 缓存 线 ， 数 组 中 的 多 个 元 素 会 出 现在 同一 个 缓存 
线 。 这 样 即 使 线程 只 访问 自己 相关 的 数据 ， 仍 然 会 有 乒乓 缓存 。 一 个 线程 在 更 改 其 访问 
的 数据 时 ， 缓 存 线 的 所 有 权 需 要 转移 到 其 所 在 的 处 理 器 ， 而 另 一 个 线程 所 需 的 数据 可 能 
也 在 这 个 缓存 线 上 ， 当 它 访 问 时 缓存 线 又 要 再 次 转移 。 这 个 缓存 线 是 两 者 共享 的 ， 然 而 
其 中 的 数据 并 不 共享 ， 因 此 被 称 为 假 共 享 (false sharing)。 这 里 的 解决 方案 是 构造 好 数 
据 的 结构 ， 使 得 被 同一 个 线程 访问 的 数据 在 内 存 中 也 是 相 邻 的 ， 这 样 就 更 可 能 出 现在 同 
一 个 缓存 线 ， 而 不 同 线程 访问 的 数据 则 分 散在 内 存 中 ， 使 之 更 可 能 地 出 现在 不 同 的 缓存 
线 。 本 章 稍 后 会 介绍 如 何 根据 这 个 要 求 设计 数据 和 代码 。 

如 果 说 多 个 线程 访问 同一 个 缓存 线 有 害 ， 那 么 单个 线程 访问 的 数据 的 内 存 布局 又 有 
什么 影响 呢 ? 


8.2.4 数据 应 该 多 紧密 


假 共享 是 由 于 一 个 线程 访问 的 数据 与 男 一 个 线程 的 靠 得 太 近 , 而 男 一 个 与 数据 布局 
直接 相关 的 性 能 隐患 则 来 自 一 个 线程 本 身 。 根 源 是 数据 的 相 邻 度 。 如 果 线 程 访 问 的 数据 
分 散在 内 存 中 ， 意 味 着 这 些 数据 分 布 在 各 个 缓存 线 上 。 因 此 ， 更 多 的 缓存 线 需 要 加 载 到 
处 理 器 的 缓存 中 ， 这 会 增加 内 存 访问 延迟 ， 性 能 要 低 于 数据 分 布 紧密 的 情况 。 

同时 ， 这 也 会 增加 线程 需要 的 某 个 缓存 线 同 时 含有 其 他 线程 访问 的 数据 的 可 能 性 。 
极端 情况 下 ,缓存 中 无 关 的 数据 会 多 于 你 关心 的 数据 。 这 会 浪费 宝贵 的 缓存 空间 ， 迫 使 
处 理 器 将 需要 的 数据 移出 缓存 来 腾 出 空间 ,这样 更 容易 缓存 未 命中 而 不 得 不 从 内 存 中 获 
取 数 据 。 

这 对 单线 程 代码 的 性 能 很 重要 ， 而 我 们 在 这 里 考虑 它 的 原因 是 任务 切换 〈task 
switching)。 如 果 有 多 余 CPU 核 数 量 的 线程 ， 每 个 核 都 将 运行 多 个 线程 。 这 会 增加 缓存 
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的 压力 ， 因 为 你 要 保证 不 同 线程 访问 不 同 的 缓存 线 以 避免 假 共享 。 因 此 ， 当 处 理 器 切换 
线程 时 ， 数 据 分 散在 多 个 缓存 线 比 每 个 线程 的 数据 都 紧 靠 在 同一 个 缓存 线 ， 更 可 能 需要 
重 载 这 些 缓存 线 。 

如 果 线 程 数 多 于 核 或 者 处 理 器 处 理 , 操作 系统 可 能 也 会 选择 在 一 个 核 上 给 某 个 线程 
分 配 一 个 时 间 片 ， 之 后 又 到 另 一 个 核 上 给 这 个 线程 分 配 时 间 片 。 这 就 需要 将 这 个 线程 所 
需 的 缓存 线 从 第 一 个 核 转移 到 第 二 个 核 。 需 要 转移 的 缓存 线 越 多 ， 消 耗 的 时 间 也 越 多 。 
尽管 操作 系统 通常 会 尽 可 能 避免 这 种 情况 ， 这 种 现象 仍然 存在 并 且 一 旦 发 生 就 会 严重 影 
响 性 能 。 

任务 切换 导致 的 问题 在 大 量 线程 处 于 就 绪 而 不 是 等 待 状态 时 特别 突出 。 这 是 我 们 已 
经 接触 过 的 问题 : 过 度 订阅 。 


8.2.5 过 度 订 阅 和 过 多 的 任务 切换 


在 多 线程 的 系统 中 ， 线 程 数 量 通常 会 多 于 处 理 器 数量 ， 除 非 你 使 用 的 是 大 规模 并 行 
处 理 机 。 然 而 ， 线 程 经 常 花 时 间 等 待 外 部 UO 操作 完成 或 者 因为 互 斥 元 而 阻塞 ， 又 或 者 
在 等 待 一 个 条 件 变 量 等 ， 因 此 数量 多 于 处 理 器 并 不 会 带 来 间 题 。 多 出 的 线程 可 以 让 程序 
进行 有 用 的 工作 而 不 是 使 处 理 器 空闲 等 待 。 

但 是 这 不 总 是 好 事 。 当 你 有 太 多 的 线程 时 ， 你 会 有 多 余 可 用 处 理 器 的 就 绪 线程 ， 操 
作 系统 将 会 开始 频繁 的 任务 切换 以 保证 所 有 线程 享有 适当 的 时 间 片 。 我 们 在 第 1 章 看 到 
过 ， 这 会 增加 任务 切换 的 额外 开销 ， 并 且 由 于 数据 没有 相 邻 导致 的 一 系列 缓存 问题 。 过 
度 订 阅 会 在 以 下 情况 产生 : 你 有 任务 无 限制 地 生成 新 的 线程 ， 如 第 4 章 递归 调用 的 快速 
排序 ， 或 者 你 根据 任务 类 型 分 配 的 线程 数量 大 于 处 理 器 的 数量 ， 而 任务 更 依赖 于 CPU 
而 不 是 IO。 

如 果 你 只 是 因为 划分 数据 产生 了 太 多 的 线程 ， 你 可 以 简单 的 限制 工作 线程 的 数量 ， 
就 像 我 们 在 8.1.2 节 见 过 的 一 样 。 如 果 过 度 订阅 来 自 于 对 任务 类 型 的 划分 ， 你 就 没有 什 
么 改进 的 余地 了 ， 这 时 选择 合适 的 划分 也 许 超出 了 你 对 目标 平台 的 知识 储备 ， 除 非 性 能 
无 法 接受 而 且 能 证 明 对 划分 的 改变 确实 可 以 提高 性 能 才 值得 去 做 。 

其 他 因素 也 能 影响 多 线程 代码 的 性 能 。 乒乓 缓存 的 代价 在 两 个 单 核 处 理 器 和 一 个 双 
核 处 理 器 上 会 有 很 大 的 差异 ， 哪 怕 两 个 平台 的 CPU 类 型 和 时 钟 频率 都 一 样 。 以 上 都 是 
重要 的 因素 ， 对 性 能 有 显著 的 影响 。 现 在 ， 让 我 们 了 解 一 下 这 会 如 何 影 响 我 们 代码 和 数 
据 结构 的 设计 。 


83 为 多 线程 性 能 设计 数据 结构 
在 8.1 节 中 我 们 看 到 了 在 线程 间 划分 工作 的 一 些 方法 ， 在 82 节 中 我 们 看 到 了 影响 
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代码 性 能 的 一 些 因素 。 当 设计 多 线程 性 能 的 数据 结构 的 时 候 如 何 使 用 这 些 信息 呢 ? 这 是 
在 第 6 章 和 第 7 章 中 处 理 的 很 困难 的 问题 ， 是 关于 设计 可 以 安全 并 行 读 取 的 数据 结构 。 
正如 你 在 8.2 节 中 看 到 的 一 样 ， 即 使 没有 别 的 线程 共享 此 数据 ， 单 个 线程 使 用 的 数据 布 
局 也 会 对 它 产生 影响 。 

当 为 多 线程 性 能 设计 你 的 数据 结构 时 需要 考虑 的 关键 问题 是 竞争 、 假 共享 以 及 数据 
接近 。 这 三 个 方面 都 会 对 性 能 产生 很 大 影响 ， 并 且 通 常 你 可 以 通过 改变 数据 布局 或 者 改 
变 分 配给 某 线程 的 数据 元 素来 提高 性 能 。 首 先 ， 我 们 来 看 一 个 简单 的 例子 ， 在 线程 间 划 
分 数组 元 素 。 


8.3.1 为 复杂 操作 划分 数组 元 素 


假设 你 正在 做 一 些 复杂 的 数学 计算 , 你 需要 将 两 个 大 矩阵 想 乘 。 为 了 实现 矩阵 相 乘 ， 
你 将 第 一 个 矩阵 的 第 一 行 每 个 元 素 与 第 二 个 矩阵 的 第 一 列 相对 应 的 每 个 元 素 相 乘 , 并 将 
结果 相 加 得 到 结果 矩阵 左上 角 第 一 个 元 素 。 然 后 你 继续 将 第 二 行 与 第 一 列 相 乘 得 到 结果 
矩阵 第 一 列 的 第 二 个 元 素 ， 以 此 类 推 。 正 如 图 8.3 所 示 ， 突 出 显示 的 部 分 表明 了 第 一 个 
矩阵 的 第 二 行 与 第 二 个 矩阵 的 第 三 列 配 对 ， 得 到 结果 矩阵 的 第 三 列 第 二 行 的 值 。 


81,1 82,1 83,1 841 an,1 


bi bo 4l Du 1 bk C1,1 C2,1 C3,1 C44 77 
bi2b22]]99lb42 .+ bk2 012 c22 m DT 


8138238336843 … Ang b13 ba, bas +++ — bk3 013 C23 C33 C43 ++ 


81,m82,m83,n84,m *** — 8nm C1,m C2,m C3,m C4,m *** 


图 8.3 矩阵 相 乘 


为 了 值得 使 用 多 线程 来 优化 该 乘法 运算 ,现在 我 们 假设 这 些 都 有 几 千 行 和 几 于 列 的 
大 和 矩阵。 通常 ， 非 稀 琉 抢 阵 在 内 存 中 是 用 一 个 大 数组 表示 的 ， 第 一 行 的 所 有 元 素 后 面 是 
第 二 行 的 所 有 元 素 ， 以 此 类 推 。 为 了 实现 矩阵 相 乘 ， 现 在 就 有 三 个 大 数组 了 。 为 了 获得 
更 优 的 性 能 ， 你 就 需要 注意 数据 存 取 部 分 ， 特 别 是 第 三 个 数组 。 

有 很 多 在 线程 间 划 分 工作 的 方法 。 假设 你 有 比 处 理 器 更 多 的 行 / 列 , 那么 你 就 可 以 让 
每 个 线程 计算 结果 和 矩阵 中 某 些 列 的 值 ， 或 者 让 每 个 线程 计算 结果 抢 阵 中 某 些 行 的 值 ,或 
者 甚至 让 每 个 线程 计算 结果 矩阵 中 规则 矩形 子 集 的 值 。 

回顾 8.2.3 节 和 8.2.4 节 , 你 就 会 发 现 读 取 数 组 中 的 相 邻 元 素 比 到 处 读 取 数 组 中 的 值 
要 好 ， 因 为 这 样 减少 了 缓存 使 用 以 及 假 共享 。 如 果 你 使 每 个 线程 处 理 一 些 列 ， 那 么 就 需 
要 读 取 第 一 个 矩阵 中 的 所 有 元 素 以 及 第 二 个 矩阵 中 相对 应 的 列 中 元 素 , 但 是 你 只 会 得 到 
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列 元 素 的 值 。 假 设 和 矩阵 是 用 行 顺序 存储 的 ， 这 就 意味 着 你 从 第 一 行 中 读 取 NN 个 元 素 ， 从 
第 二 行 中 读 取 N 个 元 素 ， 以 此 类 推 (N 的 值 是 你 处 理 的 列 的 数目 )。 别 的 线程 会 读 取 每 
一 行 中 别 的 元 素 , 这 就 很 清楚 你 应 该 读 取 相 邻 的 的 列 , 因此 每 行 的 V 个 元 素 就 是 相 邻 的 ， 
并 且 最 小 化 了 假 共享 。 当 然 ， 如 果 这 个 元 素 使 用 的 空间 与 缓存 线 的 数量 相等 的 话 ， 就 
不 会 有 假 共享 ， 因 为 每 个 线程 都 会 工作 在 独立 的 缓存 线 上 。 

另 一 方面 ， 如 果 每 个 线程 处 理 一 些 行 元 素 ， 那么 就 需要 读 取 第 二 个 矩阵 中 的 所 有 元 
素 ， 以 及 第 一 个 矩阵 中 相关 的 行 元 素 ， 但 是 它 只 会 得 到 行 元 素 。 因 为 矩阵 是 用 行 顺序 存 
R, 因此 你 现在 读 取 从 WN 行 开始 的 所 有 元 素 。 如 果 你 选择 相 邻 的 行 ， 那么 就 意味 着 此 
线程 是 现在 唯一 对 这 N 行 写 人 的 线程 ; 它 拥 有 内 存 中 连续 的 块 ， 并且 不 会 被 别 的 线程 访 
间 。 这 就 比 让 每 个 线程 处 理 一 些 列 元素 更 好 ， 因 为 唯一 可 能 产生 假 共享 的 地 方 就 是 一 块 
的 最 后 一 些 元 素 与 下 一 个 块 的 开始 一 些 元 素 。 但 是 值得 花 时 间 确 认 目 标 结构 。 

第 三 种 选择 一 划分 为 矩形 块 如 何 呢 ? 这 可 以 被 看 做 是 先 划分 为 列 ， 然 后 划分 为 行 。 
它 与 根据 列 元 素 划 分 一 样 存在 假 共享 问题 。 如 果 你 可 以 选择 块 的 列 数目 来 避免 这 种 问 
题 ， 那 么 从 读 这 方面 来 说 ， 划 分 为 矩形 块 有 这 样 的 优点 ; 你 不 需要 读 取 任何 一 个 完整 的 
源 和 矩阵 。 你 只 需要 读 取 相 关 的 目标 矩阵 的 行 与 列 的 值 。 从 具体 方面 来 看 , 考虑 两 个 1000 
行 和 1000 列 的 矩阵 相 乘 。 就 有 一 百 万 个 元 素 。 如 果 你 有 100 个 处 理 器 ， 那 么 每 个 线程 
可 以 处 理 10 行 元 素 。 尽 管 如 此 ， 为 了 计算 这 10000 个 元 素 ， 需 要 读 取 第 二 个 矩阵 的 所 
有 元 素 (一 百 万 个 元 素 ) 加 上 第 一 个 矩阵 相关 行 的 10000 个 元 素 , 总 计 1010000 个 元 素 ， 
另 一 方面 ， 如 果 每 个 线程 处 理 100 fr 100 列 的 矩阵 块 (总 计 10000 个 元 素 ) ， 那 么 它们 
需要 读 取 第 一 个 矩阵 的 100 行 元 素 (100 x 1000=100000 个 元 素 ) 和 第 二 个 矩阵 的 100 
NICK 〈 另 一 个 100000 个 元 素 )。 这 就 只 有 200000 个 元 素 ， 将 读 取 的 元 素数 量 降低 到 
五 分 之 一 。 如 果 你 读 取 更 少 的 元 素 ， 那 么 发 生 缓存 未 命中 和 更 好 性 能 的 潜力 的 机 会 就 更 
^^. : 

因此 将 结果 和 矩阵 划分 为 小 的 方块 或 者 类 似 方块 的 矩阵 比 每 个 线程 完全 人 处理 好 几 行 
更 好 。 当 然 ， 你 可 以 调整 运行 时 每 个 块 的 大 小 ， 取 决 于 矩阵 的 大 小 以 及 处 理 器 的 数量 。 
如 果 性 能 很 重要 ， 基 于 目标 结构 分 析 各 种 选择 是 很 重要 的 。 

你 也 有 可 能 不 进行 矩阵 乘法 , 那么 它 是 否 适用 呢 ” 当 你 在 线程 间 划 分 大 块 数据 的 时 
IR, 同样 的 原则 也 适用 于 这 种 情况 。 仔 细 观 察 数据 读 取 方式 ， 并 且 识 别 影响 性 能 的 潜在 
原因 。 在 你 遇 到 的 问题 也 可 能 有 相似 的 环境 ， 就 是 只 要 改变 工作 划分 方式 可 以 提高 性 能 
而 不 需要 改变 基本 算法 。 

好 了 ， 我 们 已 经 看 到 数组 读 取 方 式 是 如 何 影 响 性 能 的 。 其 他 数据 结构 类 型 呢 ? 


8.3.2 ”其 他 数据 结构 中 的 数据 访问 方式 
从 根本 上 说 ， 当 试图 优化 别 的 数据 结构 的 数据 访问 模式 时 也 是 适用 的 。 
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W 在 线程 间 改 变数 据 分 配 ， 使 得 相 领 的 数据 被 同一 个 线程 适用 。 

国 最 小 化 任何 给 定 线程 需要 的 数据 。 

图 ”确保 独立 的 线程 访问 的 数据 相隔 足够 远 来 避免 假 共享 。 

当然 ， 运 用 到 别 的 数据 结构 上 是 不 容易 的 。 例 如 ， 二 叉 树 本 来 就 很 难 用 任何 方式 来 
再 分 , 有 用 还 是 没 用 , 取决 于 树 是 如 何平 衡 的 以 及 你 需要 将 它 划 分 为 多 少 个 部 分 。 同样， 
树 的 本 质 意味 着 结 点 是 动态 分 配 的 ， 并 且 最 后 在 堆 上 不 同 地 方 。 

现在 ， 使 数据 最 后 在 堆 上 不 同 地 方 本 身 不 是 一 个 特别 的 问题 ， 但 是 这 意味 着 处 理 咒 
需要 在 缓存 中 保持 更 多 东西 。 实 际 上 这 可 以 很 有 利 。 如 果 多 个 线程 需要 遍历 树 ， 那 么 它 
们 都 需要 读 取 树 的 结 点 ， 但 是 如 果树 的 结 点 至 包含 指向 该 结 点 持 有 数据 的 指针 ， 那 么 当 
需要 的 时 候 ， 处 理 器 就 必须 从 内 存 中 载 人 数据 。 如 果 线 程 正 在 修改 需要 的 数据 ， 这 就 可 
以 避免 结 点 数据 与 提供 树 结构 的 数据 间 的 假 共享 带 来 的 性 能 损失 。 

使 用 互 斥 元 保护 数据 的 时 候 也 有 同样 的 问题 。 假 设 你 有 一 个 简单 的 类 ， 它 包含 一 些 
数据 项 和 一 个 互 斥 元 来 保护 多 线程 读 取 。 如 果 互 斥 元 和 数据 项 在 内 存 中 离 得 很 近 ， 对 于 
使 用 此 互 斥 元 的 线程 来 说 就 很 好 ， 它 需要 的 数据 已 经 在 处 理 器 缓存 中 了 ， 因 为 为 了 修改 
互 斥 元 已 经 将 它 载 人 了 。 但 是 它 也 有 一 个 缺点 ; 当 第 一 个 线程 持 有 互 斥 元 的 时 候 ， 如 果 
别 的 线程 试图 锁 住 互 斥 元 ， 它 们 就 需要 读 取 内 存 。 互 斥 元 的 锁 通常 作为 一 个 在 互 斥 元 内 
的 存储 单元 上 试图 获取 互 斥 元 的 读 一 修改 一 写 原子 操作 来 实现 的 ,如果 互 斥 元 已 经 被 锁 
的 话 ， 就 接着 调用 操作 系统 内 核 。 这 个 读 一 修改 一 写 操 作 可 能 导致 拥有 互 斥 元 的 线程 持 
有 的 缓存 中 的 数据 变 得 无 效 。 只 要 使 用 互 斥 元 ， 这 就 不 是 问题 。 尽 管 如 此 ， 如 果 互 斥 元 
和 线程 使 用 的 数据 共享 同一 个 缓冲 线 ,那么 拥有 此 互 斥 元 的 线程 的 性 能 就 会 因为 另 一 个 
线程 试图 锁 住 该 互 斥 元 而 受到 影响 。 

测试 这 种 假 共享 是 否 是 一 个 问题 的 方法 就 是 在 数据 元 素 间 增加 可 以 被 不 同 的 线程 
并 发 读 取 的 大 块 填充 数据 。 例 如 ， 你 可 以 使 用 : 
struct protected data 


std: :mutex m; 65536 字 节 是 为 了 显著 大 于 
3 | 缓存 


char padding[65536]; 
my data data to protect; 


来 测试 互 斥 元 竞争 问题 或 者 使 用 : 
struct my_data 


data iteml dl; 

data item2 d2; 

char padding [65536]; 
Hm 


my data some array[256]; 


来 测试 数组 数据 是 否 假 共享 。 如 果 这 样 做 提高 了 性 能 ， 就 可 以 得 知 假 共享 确实 是 一 
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个 间 题 ， 并 且 你 可 以 保留 填充 数据 或 者 通过 重新 安排 数据 读 取 的 方式 来 消除 假 共享 。 
当然 ， 当 设计 并 发 性 的 时 候 ， 不仅 需要 考虑 数据 读 取 模式 ， 因 此 让 我 们 来 看 看 别 的 
需要 考虑 的 方面 。 


为 并 发 设计 时 的 额外 考虑 


本 章 我 们 看 了 一 些 在 线程 间 划 分 工作 的 方法 ， 影 响 性 能 的 因素 ， 以 及 这 些 因素 是 如 
何 影响 你 选择 哪 种 数据 读 取 模 式 和 数据 结构 的 。 但 是 ,设计 并 发 代码 需要 考虑 更 多 。 你 
需要 考虑 的 事情 例如 异常 安全 以 及 可 扩展 性 。 如 果 当 系统 中 处 理 核心 增加 时 性 能 (无 论 
是 从 减少 执行 时 间 还 是 从 增加 吞吐 量 方面 来 说 ) 也 增加 的 话 ， 那 么 代码 就 是 可 扩展 的 。 
从 理论 上 说 ,性 能 增加 是 线性 的 。 因 此 一 个 有 100 个 处 理 器 的 系统 的 性 能 比 只 有 一 个 处 
理 右 的 系统 好 100 fit. 

即使 代码 不 是 可 扩展 的 ， 它 也 可 以 工作 。 例 如 ， 单 线程 应 用 不 是 可 扩展 的 ， 异 常安 
全 是 与 正确 性 有 关 的 。 如 果 你 的 代码 不 是 异常 安全 的 ,就 可 能 会 以 破碎 的 不 变量 或 者 竞 
争 条 件 结束 ， 或 者 你 的 应 用 可 能 因为 一 个 操作 抛 出 异常 而 突然 终止 。 考 虑 到 这 些 ， 我 们 
将 首先 考虑 异常 安全 。 


8.4.1 并行 算法 中 的 异常 安全 


异常 安全 是 好 的 C++ 代码 的 一 个 基本 方面 ， 使 用 并 发 性 的 代码 也 不 例外 。 实 际 上 ， 
并 行 算法 通常 比 普通 线性 算法 需要 你 考虑 更 多 关于 异常 方面 的 问题 。 如果 线性 算法 中 的 
操作 抛 出 异常 ， 该 算法 只 要 考虑 确保 它 能 够 处 理 好 以 避免 资源 泄漏 和 破碎 的 不 变量 。 它 
可 以 允许 扩大 异常 给 调用 者 来 处 理 。 相 比 之 下 ， 在 并 行 算法 中 ,很 多 操作 在 不 同 的 线程 
上 运行 。 在 这 种 情况 下 ， 就 不 允许 扩大 异常 了 ， 因 为 它 在 错误 的 调用 栈 中 。 如 果 一 个 函 


. 数 大 量 产 生 以 异常 结束 的 新 线程 ， 那 么 该 应 用 就 会 被 终止 。 


作为 一 个 具体 的 例子 ， 我 们 来 回顾 清单 2.8 中 的 parallel accumulate 函数 ， 
清单 82 中 会 做 一 些 修改 。 


清单 8.2 std:accumulate 的 并 行 版 本 (来自 清单 2.8) 


template<typename Iterator,typename T> 
struct accumulate block 


{ 


void operator() (Iterator first,Iterator last,T& result) 


result=std::accumulate(first,last,result) ; +@ 
} 
he 


template<typename Iterator,typename T> 
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T parallel accumulate(Iterator first,Iterator last,T init) 


{ 


unsigned long const length=std: :distance (first, last) ; «9 


if(!length) 
return init; 


unsigned long const min per thread-25; 
unsigned long const max threads- 
(length«min per thread-1)/min per thread; 


unsigned long const hardware threads- 
std: :thread: :hardware_concurrency () ; 


unsigned long const num_threads= 
std: :min(hardware_threads!=0?hardware_threads:2,max_threads) ; 


unsigned long const block_size=length/num_threads; 


std: :Vector<T> results (num_threads) ; -© 
std::vector<std::thread> threads (num threads-1); 0 
Iterator block_start=first; 0 
for (unsigned long i=0;i<(num_threads-1);++i) 
{ 

Iterator block end-block start; +@ 

std: : advance (block_end,block_size) ; 

threads [i] =std: : thread ( +@ 


accumulate_block<Iterator,T>(), 
block start,block end,std::ref(results[i])); 
block start-block end; +O 
} 


accumulate block() (block_start, last, results [num_threads-1]) ; 0 


std::for each(threads.begin(),threads.end(), 
std::mem f£n(&std::thread::join)); 


return std: :accumulate (results.begin(),results.end(),init); «p 


现在 我 们 检查 并 且 确 定 抛 出 异常 的 位 置 : 总 的 说 来 ， 任 何 调用 函数 的 地 方 或 者 在 用 
户 定义 的 类 型 上 执行 操作 的 地 方 都 可 能 抛 出 异常 。 

首先 ， 你 调用 distance, 它 在 用 户 定义 的 迭代 器 类 型 上 执行 操作 。 因 为 你 还 没 
有 进行 任何 工作 ， 并 且 这 是 在 调用 线程 上 ， 所 以 这 是 没 问题 的 。 下 一 步 ， 你 分 配 了 
results 迭代 器 上 日 和 threads 迭代 器 @。 同 样 ， 这 是 在 调用 线程 上 ， 并 且 你 没有 做 
任何 工作 或 者 生产 任何 线程 ， 因 此 这 是 没 问题 的 。 当 然 ， 如 果 threads 构造 函数 抛 出 
异常 ， 那 么 就 必须 清楚 为 results 分 配 的 内 存 ， 析 构 函 数 将 为 你 完成 它 。 

跳 过 block_start 的 初始 化 @ 因为 这 是 安全 的 ， 就 到 了 产生 线程 的 循环 中 的 操 
作 @、@、@。 一 旦 在 @ 中 创造 了 第 一 个 线程 ， 如 果 抛 出 异常 的 话 就 会 很 麻烦 ， 你 的 新 
std: : thread 对 象 的 析 构 函数 会 调用 std:: terminate 然后 中 止 程序 。 

调用 accumulate block@ 也 可 能 会 抛 出 异常 ， 你 的 线程 对 象 将 被 销毁 并 且 调 用 
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std::terminate, 另 一 方面 ， 最 后 调用 std: :accumulate@ 的 时 候 也 可 能 抛 出 异 
常 并 且 不 导致 任何 困难 ， 因 为 所 有 线程 将 在 此 处 汇合 。 

这 不 是 对 于 主线 程 来 说 的 ， 但 是 也 可 能 抛 出 异常 ， 在 新 线程 上 调用 accumulate. 
block 可 能 抛 出 异常 @。 这 里 没有 任何 catch 块 ， 因 此 该 异常 将 被 稍 后 处 理 并 且 导 致 
库 调用 std: :terminate () 来 中 止 程序 。 

即使 不 是 显而易见 的 ， 这 段 代码 也 不 是 异常 安全 的 。 


1. 增加 异常 安全 性 


好 了 ,我 们 识别 出 了 所 有 可 能 抛 出 异常 的 地 方 以 及 异常 所 造成 的 不 好 影响 。 那 么 如 
何 处 理 它 呢 ? 我 们 先 来 解决 在 新 线程 上 抛 出 异常 的 问题 。 

在 第 4 章 中 介绍 了 完成 此 工作 的 工具 。 如 果 你 仔细 考虑 在 新 线程 中 想 获得 什么 ， 那 
么 很 明显 当 允 许 代码 抛 出 异常 的 时 候 , 你 试图 计算 结果 来 返回 。 std: :packaged task 
Al std: : future 的 组 合 设计 是 恰好 的 。 如 果 你 重新 设计 代码 来 使 用 std: :packaged 
task， 就 以 清单 8.3 中 的 代码 结束 。 


清单 8.3 使 用 std::packaged task 的 std::accumulate 的 并 行 版 本 


template<typename Iterator,typename T» 
Struct accumulate block 


{ 


T operator() (Iterator first,Iterator last) EX 1) 
{ 
return std::accumulate(first,last,T()); «e 
) 
template<typename Iterator,typename T» 
T parallel accumulate(Iterator first,Iterator last,T init) 


unsigned long const length=std::distance (first,last); 


if(!length) 
return init; 


unsigned long const min per thread-25; 
unsigned long const max threads- 
(lengthe«min per thread-1)/min per thread; 


unsigned long const hardware threads- 
std::thread: :hardware_concurrency () ; 


unsigned long const num_threads= 
Std::min(hardware threads!-0?hardware threads:2,max threads); 


unsigned long const block size-length/num threads; 


Std::vector«std::future«T» > futures (num threads-1); -© 
std: :Vector<std: :thread> threads (num threads-1); 
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Iterator block start-first; 

for (unsigned long i=0;i<(num_threads-1) ; ++i) 

{ 
Iterator block end-block start; 
Std::advance(block end,block size); 
std: :packaged_task<T(Iterator,Iterator) > task( +@ 

accumulate block«Iterator,T»()); 

futures[i]stask.get future(); 
threads[i]-std::thread(std::move(task),block start,block end); 
block start-block end; 

) 


T last result-accumulate block() (block_start, last); 0 


std::for each(threads.begin(),threads.end(), 
std::mem fn(&std::thread::join)); 


T result-init; 0 


for (unsigned long i=0;i<(num_threads-1);++i) 


result+=futures [i] .get (); 0 
} 
result += last result; -+O 
return result; 


) 


第 一 个 改变 就 是 ， 函 数 调用 accumulate block 操作 直接 返回 结果 ， 而 不 是 返回 
存储 地 址 的 引用 @。 你 使 用 std::packaged task 和 std: :future 来 保证 异常 安 
全 ， 因 此 你 也 可 以 使 用 它 来 转移 结果 。 这 就 需要 你 调用 sta: :accumulate@ 明确 使 
用 默认 构造 函数 T 而 不 是 重新 使 用 提供 的 result 值 ， 不 过 这 只 是 一 个 小 小 的 改变 。 

下 一 个 改变 就 是 你 用 futures 向 量 @， 而 不 是 用 结果 为 每 个 生成 的 线程 存储 一 个 
std: :future<T>。 在 生成 线程 的 循环 中 ， 你 首先 为 accumulate block 创造 一 个 任 
务 ©, std::packaged task<T(Iterator,Iterator) > 声明 了 有 两 个 Iterator 
并 且 返 回 一 个 了 的 任务 ,这 就 是 你 的 函数 所 做 的 。 然 后 你 将 得 到 任务 的 future@， 并 且 在 
一 个 新 的 线程 上 运行 这 个 任务 ， 输 入 要 处 理 的 块 的 起 点 和 终点 @。 当 运行 任务 的 时 候 ， 
将 在 future 中 捕捉 结果 ， 也 会 捕捉 任何 抛 出 的 异常 。 

既然 你 已 经 使 用 了 future， 就 不 再 有 结果 数组 了 ， 因 此 必须 将 最 后 一 块 的 结果 存储 
在 一 个 变量 中 @ 而 不 是 存储 在 数组 的 一 个 位 置 中 。 同 样 ， 因 为 你 将 从 future 中 得 到 值 ， 
使 用 基本 的 for 循环 比 使 用 std::accumulate 要 简单 ， 以 提供 的 初始 值 开 始 @ ， 并 
且 将 每 个 future 的 结果 累加 起 来 9。 如 果 相 应 的 任务 抛 出 异常 ， 就 会 在 future 中 捕捉 到 
并 且 调 用 get () 时 会 再 次 抛 出 异常 。 最 后 , 在 返回 总 的 结果 给 调用 者 之 前 要 加 上 最 后 一 
个 块 的 结果 @。 

因此 ， 这 就 去 除了 一 个 可 能 的 问题 ， 工 作 线程 中 抛 出 的 异常 会 在 主线 程 中 再 次 被 扫 
出 。 如 果 多 于 一 个 工作 线程 抛 出 异常 ， 只 有 一 个 异常 会 被 传播 ， 但 是 这 也 不 是 一 个 大 问 
题 。 如 果 确实 有 关 的 话 ， 可 以 使 用 类 似 std: :nested exception 来 捕捉 所 有 的 异常 
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然后 抛 出 它 。 

如 果 在 你 产生 第 一 个 线程 和 你 加 入 它们 之 间 抛 出 异常 的 话 ， 那 么 剩 下 的 问题 就 是 线 
程 泄漏 。 最 简单 的 方法 就 是 捕获 所 有 有 异常 ， 并 且 将 它们 融合 到 调用 joinable () 的 线程 
中 ， 然 后 再 次 抛 出 异常 。 


try 


{ 


for (unsigned long i=0;i< (num_threads-1) ; ++i) 


// ... as before 


} 


T last result-accumulate block() (block start,last); 


Std::for each(threads.begin(),threads.end(), 
Std::mem fn(&std::thread::join)); 


) 


Caton S.) 


{ 


for (unsigned long i=0;i<(num_thread-1) ;++i) 


if (threads [i] .joinable() ) 
thread[i] .join(); 


} 


throw; 


现在 它 起 作用 了 。 所 有 线程 将 被 联合 起 来 ， 无 论 代 码 是 如 何 离开 块 的 。 尽 管 如 此 ， 
try-catch 块 是 令 人 讨厌 的 ， 并 且 你 有 复制 代码 。 你 将 加 入 正常 的 控制 流 以 及 捕获 块 
的 线程 中 。 复制 代码 不 是 一 个 好 事情 ， 因 为 这 意味 着 需要 改变 更 多 的 地 方 。 我 们 在 一 个 
对 象 的 析 构 函数 中 检查 它 ， 毕 竟 ， 这 是 C++ 中 惯用 的 清除 资源 的 方法 。 下 面 是 你 的 类 。 


class join threads 


{ 
std::vector<std: :thread>& threads; 
public: 
explicit join_threads (std: :vector<std::thread>& threads_): 
threads (threads_) 


~join_threads () 


{ 


for (unsigned long i=0;i<threads.size() ;++i) 


if (threads [i] .joinable() ) 
threads [i] .join(); 
} 
} 


这 与 清单 2.3 中 的 thread guard 类 是 相似 的 ， 除 了 它 扩展 为 适合 所 有 线程 。 你 
可 以 如 清单 8.4 所 示 简 化 代码 。 
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清单 8.4 std::accumulate 的 异常 安全 并 行 版 本 


template<typename Iterator,typename T> 
T parallel accumulate (Iterator first,Iterator last,T init) 


{ 


unsigned long const length=std::distance(first,last) ; 


if (!length) 
return init; 


unsigned long const min_per_thread=25; 
unsigned long const max_threads= 
(length+min_per_thread-1) /min_per_thread; 


unsigned long const hardware_threads= 
std: :thread: :hardware_concurrency () ; 


unsigned long const num_threads= 
std::min(hardware threads!-0?hardware threads:2,max threads); 


unsigned long const block size-length/num threads; 


std::vector<std::future<T> > futures (num threads-1); 
std::vector<std::thread> threads (num threads-1); 
join threads joiner (threads); 


Iterator block start-first; 

for (unsigned long i=0;i<(num_threads-1) ;++1) 

( 
Iterator block end-block start; 
std: :advance (block end,block size); 
std::packaged task«T(Iterator,Iterator)» task( 

accumulate block«Iterator,T»()); 

futures[il-task.get future(); 


threads [i]=std: :thread (std: :move (task) ,block start,block end); 
block start=block end; 

} 

T last result-accumulate block() (block start,last); 

T result=init; 

for (unsigned long i-0;i«(num threads-1);++i) 


{ 
} 


result += last_result; 
return result; 


result+=futures [i] .get(); +@O 


一 旦 你 创建 了 你 的 线程 容器 ， 也 就 创建 了 一 个 新 类 的 实例 @ 来 加 入 所 有 在 退出 的 
线程 。 你 可 以 去 除 你 的 联合 循环 ， 只 要 你 知道 无 论 函 数 是 否 退出 ， 这 些 线程 都 将 被 联合 
起 来 。 注意 调用 futures[il.get O 9 将 被 阻塞 直到 结果 出 来 , 因此 在 这 一 点 并 不 需 
要 明确 地 与 线程 融合 起 来 。 这 与 清单 8.2 中 的 原型 不 一 样 ， 在 清单 8.2 中 你 必须 与 线程 
联合 起 来 确保 正确 复制 了 结果 向 量 。 你 不 仅 得 到 了 蜡 常安 全 代码 ， 而 且 你 的 函数 也 更 短 
了 ， 因 为 将 联合 代码 提取 到 你 的 新 (可 再 用 的 ) 类 中 了 。 
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2. STD::ASYNC() 的 异常 安全 


你 已 经 知道 了 当 处 理 线程 时 需要 什么 来 实现 异常 安全 ， 我 们 来 看 看 使 用 
std: :async () 时 需要 做 的 同样 的 事情 。 你 已 经 看 到 了 , 在 这 种 情况 下 库 为 你 处 理 这 些 
线程 ， 并 且 当 future 是 就 绪 的 时 候 ， 产 生 的 任何 线程 都 完成 了 。 需 要 注意 到 关键 事情 就 
是 异常 安全 ,如 果 销 毁 future 的 时 候 没有 等 待 它 ， 析 构 函 数 将 等 待 线程 完成 。 这 就 避免 了 仍 
然 在 执行 以 及 持 有 数据 引用 的 泄漏 线程 的 问题 。 清 单 8.5 所 示 就 是 使 用 std: :async() 的 
异常 安全 实现 。 


355 8.5 使 用 std::async 的 std::accumulate 的 异常 安全 并 行 版 本 


template<typename Iterator,typename T» 

T parallel accumulate(Iterator first,Iterator last,T init) 

{ 
unsigned long const length-std::distance(first,last); EX 1] 
unsigned long const max chunk size-25; 
if(length«-max chunk size) 


return std::accumulate(first,last,init) ; +O 


} 


else 
{ 
Iterator mid point-first; 
Std::advance (mid point,length/2); +O 
std::future<T> first half results 
Std::async(parallel accumulate«Iterator,T», aO 
first,mid point,init); 


T second half result-parallel accumulate (mid point,last,T()); 0 
return first_half_result.get()+second_half_result; 
) K 
) 


这 个 版 本 使 用 递归 将 数据 划分 为 块 而 不 是 重新 计算 将 数据 划分 为 块 , 但 是 它 比 之 前 
的 版 本 要 简单 一 些 ， 并 且 是 异常 安全 的 。 如 以 前 一 样 ， 你 以 计算 序列 长 度 开始 @， 如 果 
它 比 最 大 的 块 尺寸 小 的 话 , 就 直接 调用 std: :accumulate@。 如果 它 的 元 素 比 块 尺寸 
大 的 话 ， 就 找到 中 点 @ 然后 产生 一 个 异步 任务 来 处 理 前 半 部 分 @。 范 围 内 的 第 二 部 分 
就 用 一 个 直接 的 递归 调用 来 处 理 @， 然 后 将 这 两 个 块 的 结果 累加 @。 库 确保 了 
std::async 调用 使 用 了 可 获得 的 硬件 线程 ， 并 且 没 有 创造 很 多 线程 。 一 些 “ 异 步 ” 调 
用 将 在 调用 get O 的 时 候 被 异步 执行 ©, 

这 种 做 法 的 好 处 在 于 它 不 仅 可 以 利用 硬件 并 发 ， 而且 它 也 是 异常 安全 的 。 如 果 递 归 
调用 抛 出 异常 @， 当 异常 传播 时 ， 调 用 std: :async@ 创造 的 future 就 会 被 销毁 。 它 
会 轮流 等 待 异 步 线程 结束 ， 因 此 避免 了 悬挂 线程 。 另 一 方面 ， 如 果 异 步调 用 抛 出 异常 ， 
就 会 被 future Hie, HAWA get () @ 将 再 次 抛 出 异常 。 
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当 设计 并 发 代码 的 时 候 还 需要 考虑 哪些 方面 呢 ? 让 我 们 来 看 看 可 扩展 性 。 如 果 将 你 
的 代码 迁移 到 更 多 处 理 器 系统 中 会 提高 多 少 性 能 呢 ? 


8.4.2 ”可 扩展 性 和 阿 姆 达 尔 定律 


可 扩展 性 是 关于 确保 你 的 应 用 可 以 利用 系统 中 增加 的 处 理 器 。 一 种 极端 情况 就 是 你 
有 一 个 完全 不 能 扩展 的 单线 程 应 用 ,即使 你 在 系统 中 增加 100 个 处 理 器 也 不 会 改变 性 能 。 
另 一 种 极端 情况 是 你 有 类 似 SETI@Home! 的 项 目 , 被 设计 用 来 利用 成 千 上 万 的 附加 的 处 
理 器 (以 用 户 将 个 人 计算 机 增加 到 网 络 中 的 形式 )。 

对 于 任何 给 定 的 多 线程 程序 ， 当 程序 运行 时 ， 执 行 有 用 工作 的 线程 的 数量 会 发 生变 
化 。 即 使 每 个 线程 都 在 做 有 用 的 操作 ， 初 始 化 应 用 的 时 候 可 能 只 有 一 个 线程 ， 然 后 就 有 
一 个 任务 生成 其 他 的 线程 。 但 是 即使 那样 也 是 一 个 不 太 可 能 发 生 的 方案 。 线 程 经 常 花 时 
间 等 待 彼此 或 者 等 待 VO 操作 完成 。 

除非 每 次 线程 等 待 事情 (无 论 是 什么 事情 ) 的 时 候 都 有 另 一 个 线程 在 处 理 器 上 代替 
它 ， 否 则 就 有 一 个 可 以 进行 有 用 工作 的 处 理 器 处 于 闲置 状态 。 

一 种 简单 的 方法 就 是 将 程序 划分 为 只 有 一 个 线程 在 做 有 用 的 工作 “ 串 行 的 ”部 分 和 
所 有 可 以 获得 的 处 理 器 都 在 做 有 用 工作 的 “并 行 的 ”部 分 。 如 果 你 在 有 更 多 处 理 器 的 系 
统 上 运行 你 的 应 用 ， 理 论 上 就 可 以 更 快 地 完成 “并 行 ”部 分 ， 因 为 可 以 在 更 多 的 处 理 器 
间 划 分 工作 ， 但 是 “ 串 行 的 ”部 分 仍然 是 串 行 的 。 在 这 样 一 种 简单 假设 下 ， 你 可 以 通过 
增加 处 理 器 数量 来 估计 可 以 获得 的 性 能 。 如 果 “ 连 续 的 ”部 分 组 成 程序 的 一 个 部 分 f， 
那么 使 用 W 个 处 理 器 获得 的 性 能 己 就 可 以 估计 为 


1 


sail? 


Pa 
+t 
f. N 


这 就 是 阿 姆 达 尔 定律 CAmdahl's law)， 当 谈论 并 发 代码 性 能 的 时 候 经 常 被 引用 。 
如 果 所 有 事情 都 能 被 并 行 ， 那 么 串 行 部 分 就 为 0， 加 速 就 是 W。 或 者 ， 如 果 串 行 部 分 是 
三 分 之 一 ， 即 使 有 无 限 多 的 处 理 器 ， 你 也 不 会 得 到 超过 3 的 加 速 。 

尽管 如 此 ， 这 是 一 种 很 理想 的 情况 。 因 为 任务 很 少 可 以 像 方程 式 所 需要 的 那样 被 无 
穷 划分 ， 并 且 所 有 事情 都 达到 它 所 假设 的 CPU 界限 是 很 少 出 现 的 。 正 如 你 看 到 的 ， 线 
程 执行 的 时 候 会 等 待 很 多 事情 。 

阿 姆 达尔 定律 中 有 一 点 是 明确 的 ， 那 就 是 当 你 为 性 能 使 用 并 发 的 时 候 , 值得 考虑 总 
体 应 用 的 设计 来 最 大 化 并 发 的 可 能 性 ， 并 且 确 保 处 理 器 始终 有 有 用 的 工作 来 完成 。 如 采 
你 可 以 减少 “ 串 行 ”部 分 或 者 减少 线程 等 待 的 可 能 性 ， 你 就 可 以 提高 在 有 更 多 处 理 器 的 


1 http://setiathome.ssl.berkeley.edu/ 
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系统 上 的 性 能 。 或 者 , 如 果 你 可 以 为 系统 提供 更 多 的 数据 , 并 且 保 持 并 行 部 分 准备 工作 ， 
就 可 以 减少 串 行 部 分 ， 增 加 性 能 PP 的 值 。 

从 根本 上 说 ， 可 扩展 性 就 是 当 增加 更 多 的 处 理 器 的 时 候 ， 可 以 减少 它 执行 操作 的 时 
间或 者 增加 在 一 段 时 间 内 处 理 的 数据 数量 。 有 时 这 两 点 是 相同 的 (如 果 每 个 元 素 可 以 处 
理 得 更 快 ， 那 么 你 就 可 以 处 理 更 多 数据 )， 但 是 并 不 总 是 一 样 的 。 在 选择 在 线程 间 划 分 
工作 的 方法 之 前 ， 识 别 出 可 扩展 性 的 哪些 方面 对 你 很 重要 是 很 必要 的 。 

在 这 部 分 的 开始 我 就 提 到 过 线程 并 不 是 总 有 有 用 的 工作 来 做 。 有 了 时 它们 必须 等 待 别 
的 线程 ， 或 者 等 待 IO 操作 完成 ， 或 者 别 的 事情 。 如 果 在 等 待 中 你 给 系统 一 些 有 用 的 事 
情 ， 你 就 可 以 有 效 的 “隐藏 ”等 待 。 


8.4.3 用 多 线程 隐藏 延迟 


在 很 多 关于 多 线程 代码 性 能 的 讨论 中 ， 我 们 都 假设 当 它们 真正 在 处 理 器 上 运行 时 ， 线 
程 在 “全 力 以 赴 ” 的 运行 并 且 总 是 有 有 用 的 工作 来 做 。 这 当然 不 是 正确 的 ， 在 应 用 代码 中 ， 
线程 在 等 待 的 时 候 总 是 频繁 地 被 阻塞 。 例如 ,它们 可 能 在 等 待 一 些 VO 操作 的 完成 ,等待 获 
得 互 斥 元 ， 等 待 另 一 个 线程 完成 一 些 操作 并 且 通 知 一 个 条 件 变量 ， 或 者 只 是 休 眼 一 段 时 间 。 

无 论 等 待 的 原因 是 什么 ， 如 果 你 只 有 和 系统 中 物理 处 理 单元 一 样 多 的 线程 ， 那 么 有 
阻塞 的 线程 就 意味 着 你 在 浪费 CPU 时 间 。 运 行 一 个 被 阻塞 的 线程 的 处 理 器 不 做 任何 事 
情 。 因 此 ， 如 果 你 知道 一 个 线程 将 会 有 相当 一 部 分 时 间 在 等 待 ， 那 么 你 就 可 以 通过 运行 
一 个 或 多 个 附加 线程 来 使 用 那个 空闲 的 CPU 时 间 。 

考虑 一 个 病毒 扫描 应 用 ， 它 使 用 管道 在 线程 间 划分 工作 。 第 一 个 线程 搜索 文件 系统 来 检 
查 文件 并 且 将 它们 放 到 队列 中 。 同 时 ， 另 一 个 线程 获得 队列 中 的 文件 名 ， 载 和 文件， 并 且 扫 
描 它 们 的 病毒 。 你 知道 搜索 文件 系统 的 文件 来 扫描 的 线程 肯定 会 达到 VO 界限 ， 因 此 你 就 可 
以 通过 运行 一 个 附加 的 扫描 线程 来 使 用 “空闲 的 ”CPU 时 间 。 那 么 你 就 有 一 个 搜索 文件 线程 ， 
以 及 与 系统 中 的 物理 核 或 者 处 理 器 相同 数量 的 扫描 线程 。 因 为 扫描 线程 可 能 也 不 得 不 从 磁盘 
读 取 文件 的 重要 部 分 来 扫描 它们 ， 拥 有 更 多 扫描 线程 也 是 很 有 意义 的 。 但 是 在 某 个 时 刻 会 有 
太 多 线程 ， 系 统 会 再 次 慢 下 来 因为 它 花 了 更 多 时 间 切 换 程序 ， 正 如 8.2.5 节 所 描述 的 。 

MR, 这 是 一 个 最 优化 问题 ， 因 此 测量 线程 数量 改变 前 后 的 性 能 时 很 重要 的 ， 最 有 
的 线程 数量 将 很 大 程度 上 取决 于 工作 的 性 质 和 线程 等 待 的 时 间 所 占 的 比例 。 

取决 于 应 用 ， 它 也 可 能 用 完 空闲 的 CPU 时 间 而 没有 运行 附加 的 线程 。 例 如 ， 如 果 
一 个 线程 因为 等 待 VO 操作 的 完成 而 被 阻塞 ， 那 么 使 用 可 获得 的 异步 IO 操作 就 很 有 意 
义 了 。 那 么 当 在 背后 执行 VO 操作 的 时 候 ， 线 程 就 可 以 执行 别 的 有 用 的 工作 了 。 在 别 的 
情况 下 ， 如 果 一 个 线程 在 等 待 男 一 个 线程 执行 一 个 操作 ， 那 么 等 待 的 线程 就 可 以 自己 执 
行 那 个 操作 而 不 是 被 阻塞 ， 正 如 第 7 章 中 的 无 锁 队 列 。 在 一 个 极端 的 情况 下 ， 如 果 线 程 
等 待 完成 一 个 任务 并 且 该 任务 没有 被 其 他 线程 执行 , 等 待 的 线程 可 以 在 它 内 部 或 者 另 一 
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个 未 完成 的 任务 中 执行 这 个 任务 。 清 单 8.1 中 你 看 到 了 这 个 例子 ， 在 排序 程序 中 只 要 它 
需要 的 块 没有 排 好 序 就 不 停 地 排序 它 。 

有 时 它 增 加 线程 来 确保 外 部 事件 及 时 被 处 理 来 增加 系统 响应 性 ， 而 不 是 增加 线程 来 
确保 所 有 可 得 到 的 处 理 器 都 被 应 用 了 。 


8.4.4 用 并 发 提高 响应 性 


很 多 现代 图 形 用 户 接口 框架 是 事件 驱动 的 ， 使 用 者 通过 键盘 输入 或 者 移动 鼠标 在 用 
户 接口 上 执行 操作 ， 这 会 产生 一 系列 的 事件 或 者 消息 ， 稍 后 应 用 就 会 处 理 它 。 系 统 自己 
也 会 产生 消息 或 者 事件 。 为 了 确保 所 有 事件 和 消息 都 能 被 正确 处 理 ， 通 常 应 用 都 有 下 面 
所 示 的 一 个 事件 循环 。 


while (true) 
{ 
event data event=get_event () ; 
if (event .type==quit) 
break; 
process (event); 


) 

显然 ，API 的 细节 是 不 同 的 ， 但 是 结构 通常 是 一 样 的 ， 等 待 一 个 事件 ， 做 需要 的 操 
作 来 处 理 它 ， 然 后 等 待 下 一 个 事件 。 如 果 你 有 单线 程 应 用 ， 就 会 导致 长 时 间 运 行 的 任务 
很 难 被 写 和 人， 如 8.1.3 节 描 述 的 。 为 了 确保 用 户 输入 能 被 及 时 处 理 ，get_event () 和 
process () 必须 以 合理 的 频率 被 调用 ， 无 论 应 用 在 做 什么 操作 。 这 就 意味 着 要 么 任务 
必须 定期 暂停 并 且 将 控制 交 给 事件 循环 ， 要 人 么 方便 的 时 候 在 代码 中 调用 
get event ()/process () 代码 。 每 一 种 选择 都 将 任务 的 实现 变 得 复杂 了 。 

通过 用 并 发 分 离 关 注 点 ， 你 就 可 以 将 长 任务 在 一 个 新 线程 上 执行 ， 并 且 用 一 个 专用 
的 GUI 线程 来 处 理事 件 。 线 程 可 以 通过 简单 的 方法 互相 访问 ， 而 不 是 必须 以 某 种 方式 将 
事件 处 理 代码 放 到 任务 代码 中 。 清 单 8.6 列 出 了 这 种 分 离 的 简单 概括 。 


清单 8.6 ”从 任务 线程 中 分 离 GUI 线程 


std::thread task thread; 
std::atomic<bool> task cancelled (false); 


void gui thread() 
{ 
while (true) 
{ 
event_data event=get_event () ; 
if (event .type==quit) 
break; 
process (event) ; 
) 
} 
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void task() 


{ 


while(!task_complete() && !task_cancelled) 


{ 


do next operation(); 
if(task cancelled) 


perform cleanup(); 


) 


else 


{ 


post_gui_event (task_complete) ; 


} 


void process (event data const& event) 


switch (event .type) 

{ 

case start_task: 
task_cancelled=false; 
task_thread=std: :thread (task) ; 
break; 

case stop_task: 
task_cancelled=true; 
task thread.join(); 
break; 

case task complete: 
task thread.join(); 
display results(); 
break; 

default: 
T AS 

) 

) 


通过 这 种 方式 分 离 障碍 ,用 户 线 程 能 够 及 时 地 响应 事件 ， 即 使 任务 要 执行 很 长 
时 间 。 这 种 响应 性 通常 是 使 用 应 用 时 用 户 体验 的 关键 。 无 论 何 时 执行 一 个 特定 操作 
(无 论 该 操作 是 什么 )， 应 用 都 会 被 完全 锁 住 , 这 样 使 用 起 来 就 不 方便 了 。 通 过 提供 
一 个 专用 的 事件 处 理 线程 ，GUI 可 以 处 理 GUI 特有 的 消息 (例如 调整 窗口 大 小 或 
者 重 画 窗 口 ) 而 不 会 中 断 耗 时 处 理 的 执行 , 并 且 当 它们 确实 影响 长 任务 时 会 传递 相 
关 的 消息 。 

本 章 你 看 到 了 设计 并 发 代码 的 时 候 需 要 考虑 的 问题 。 就 整体 而 言 ， 这 些 问题 是 很 大 
的 ， 但 是 当 你 习惯 了 “多 线程 编程 ”， 它 们 就 会 变 得 得 心 应 手 了 。 如 果 这 些 考虑 对 你 来 
说 很 新 ， 那 么 希望 当 你 看 到 它们 是 如 何 影响 多 线程 代码 的 具体 例子 的 时 候 ， 可 以 变 得 更 
清晰 。 
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当 为 一 个 特别 的 任务 设计 并 发 代码 的 时 候 , 你 需要 事先 考虑 每 个 描述 的 问题 的 程度 
将 取决 于 任务 。 为 了 演示 它们 是 如 何 应 用 的 , 我们 将 看 看 C++ 标准 库 中 三 个 函数 并 行 版 
本 的 实现 。 这 将 给 你 一 个 类 似 的 构造 基础 ， 提 供 了 考虑 问题 的 平台 。 作 为 奖励 ， 我们 也 
有 可 用 的 函数 实现 ， 可 用 来 帮助 并 行 一 个 更 大 的 任务 。 

我 选择 这 些 实现 主要 是 用 来 演示 特别 的 方法 而 不 是 成 为 最 高 水 平 的 实现 。 在 并 行 算 
法 学 术 文 献 或 者 在 多 线程 库 例如 Inter’s Threading Building Blocks! 中 可 以 找到 更 高 程度 
的 实现 ， 它 们 更 好 地 利用 了 可 获得 的 硬件 并 发 性 。 
” ”概念 上 最 简单 的 并 行 算法 是 std: :for_each 的 并 行 版 本 ， 我 们 就 先 从 它 
开始 。 


8.5.1 std::for_each 的 并 行 实 现 


std::for_each 在 概念 上 很 简单 , 它 轮流 在 范围 内 的 每 个 元 素 上 调用 用 户 提 
RRX, std::for_each 的 并 行 实现 和 溃 行 实现 的 最 大 区 别 就 是 函数 调用 的 顺 
J. std::for_each 用 范围 内 的 第 一 个 元 素 调 用 函数 , 然后 是 第 二 个 , 以 此 类 推 。 
然而 使 用 并 行 实现 就 不 能 保证 元 素 被 处 理 的 顺序 ,它们 可 能 (实际 上 我 们 希望 ) 被 
并 发 处 理 。 

为 了 实现 并 行 版 本 ,你 只 需要 将 这 个 范围 划分 为 元 素 集合 在 每 个 线程 上 处 理 。 你 事 
先知 道 了 元 素数 量 ， 因 此 你 可 以 在 处 理 开 始 前 划分 数据 (参见 8.1.1 节 )。 我 们 假设 这 是 
唯一 在 运行 的 并 行 任务 ， 那 么 就 可 以 使 用 std::thread::hardware. 
concurrency () 来 决定 线程 的 数量 。 你 也 知道 元 素 可 以 被 独立 地 处 理 ， 因 此 你 可 以 使 
用 临近 的 块 来 避免 假 共享 (参见 82.3 节 )。 

这 个 算法 与 8.4.1 节 中 描述 的 std::accumulate 的 并 行 版 本 在 概念 上 是 类 似 
的 ， 但 是 不 计算 每 个 元 素 的 和 ， 你 只 要 应 用 具体 函数 。 尽 管 你 可 能 推测 这 会 大 大 简 
化 代码 ， 因 为 它 不 返回 结果 。 如 果 你 想 传 递 异 常 给 调用 者 ， 你 仍然 需要 使 用 
std::packaged task 和 std::future 方法 在 线程 间 传 递 异 常 。 一 个 简单 的 实 
现 如 清单 8.7 所 示 。 


清单 8.7 std::for_each 的 并 行 版 本 


template<typename Iterator,typename Func» 
void parallel for each(Iterator first,Iterator last,Func £) 


! http://threadingbuildingblocks.org/ 


242 


第 8 章 设计 并 发 代码 


unsigned long const length-std::distance(first,last); 


if(!length) 
return; 


unsigned long const min per thread-25; 
unsigned long const max threads- 
(length«min per thread-1)/min per thread; 


unsigned long const hardware threads- 
Std::thread::hardware concurrency(); 


unsigned long const num threads- 
std::min(hardware threads!-0?hardware threads:2,max threads); 


unsigned long const block size-length/num threads; 


Std::vector«std::future«void» » futures (num threads-1); 0 
Std::vector«std::thread» threads (num threads-1); 
join threads joiner (threads); 


Iterator block startesfirst; 
for (unsigned long i=0;i< (num_threads-1) ;++i) 
{ 
Iterator block_end=block_start; 
std: :advance (block_end, block_size) ; 
std: :packaged_task<void(void) > task ( a 
[=] 0 


{ 
Std::for each(block start,block end,f); 
ny 
futures[i]stask.get future(); 
threads [i] =std: : thread (std: :move (task) ) ; 0 
block_start=block_end; 
} 
Std::for each(block start,last,f); 
for (unsigned long i=0;i<(num_threads-1) ;++i) 


{ 
} 


futures [i] .get (); +O 


这 段 代码 的 基础 结构 与 清单 8.4 中 的 代码 是 一 样 的 。 关 键 的 不 同 之 处 在 于 futures 
向 量 存储 了 std: : future<void>@， 因 为 工作 线程 不 返回 值 ， 并 且 在 这 个 任务 上 使 
用 一 个 简单 lambda 函数 激活 了 从 block_start 8l block end 范围 上 的 函数 f@。 这 
就 避免 了 将 范围 传递 给 线程 构造 函数 日 。 因 为 工作 线程 不 返回 值 ， 调 用 
future[i] .get () @ 只 提供 取 回 工作 线程 抛 出 的 异常 的 方法 ， 如 果 你 不 希望 传递 异 
常 ， 那 么 你 就 可 以 省 略 它 。 

正如 你 的 std: :accumulate 的 并 行 实现 可 以 通过 使 用 std: :async 被 简化 , A 
此 你 的 Parallel_for each 也 可 以 被 简化 。 它 的 实现 如 清单 8.8 所 示 。 
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清单 8.8 使 用 std::async 的 std::for_each 的 并 行 版 本 


template<typename Iterator, typename Func> 
void parallel for each(Iterator first,Iterator last,Func f) 


{ 


unsigned long const length-std::distance(first,last); 


if (!length) 
return; 


unsigned long const min per thread-25; 
if(length«(2*min per thread)) 
std::for each(first,last,f); 0 


) 


else 
{ 
Iterator const mid point-first«length/2; 
Std::future«void» first half- 
std::async(&parallel for each«Iterator,Func», 
first,mid point,f); 
parallel for each(mid point,last,f); «e 


first half.get(); 
0 


) 


如 同 清单 8.5 中 基于 std: :async fy parallel accumulate 一 样 ， 你 递归 地 划 
分 数据 而 不 是 在 执行 前 划分 数据 ， 因 为 你 不 知道 库 会 使 用 多 少 线程 。 如 以 前 一 样 ， 每 一 
步 都 将 数据 划分 为 两 部 分 , 异步 运行 前 半 部 分 @ 并 且 直 接 运 行 后 半 部 分 @ 直到 剩 下 的 
数据 太 小 而 不 值得 划分 ,在 这 种 情况 下 会 调用 std: :for_each@。 使 用 std: :async 
和 get () LA std: : future@ 提供 了 异常 传播 语义 。 

让 我 们 从 必须 在 每 个 元 素 上 执行 相同 操作 的 算法 转移 到 稍微 复杂 的 例子 
stdevfind 


8.5.2 std::find 的 并 行 实现 


std: :find 是 下 一 个 考虑 的 有 用 的 算法 ， 因 为 它 是 不 用 处 理 完 所 有 元 素 就 可 以 完 
成 的 几 个 算法 之 一 。 例 如 ， 如 果 范 围 内 的 第 一 个 元 素 符合 搜索 准则 ， 那 么 就 不 需要 检查 
别 的 元 素 。 稍 后 你 将 看 到 , 这 是 性 能 的 一 个 重要 属性 , 并 且 对 设计 并 行 实现 有 直接 影响 。 
这 是 数据 读 取 部 分 可 能 影响 代码 设计 的 一 个 特殊 例子 (参见 8.3.2 节 )。 这 类 别 的 算法 包 
括 std: :equal #] std: :any_of。 

UNEASE BR YE DEBE BO A PSR RIA, 如 果 你 找到 了 
相片 就 应 该 让 他 们 也 停止 寻找 。 你 要 让 他 们 知道 你 已 经 找到 了 相片 (可 以 通过 呼喊 ,“ 找 
到 了 ”) ， 这 样 他 们 就 可 以 停止 寻找 并 且 做 别 的 事情 。 很 多 算法 的 天 性 是 处 理 每 个 元 素 ， 
因此 它们 没有 呼喊 “找到 了 ”。 对 于 算法 例如 stq: :find， 早 日 完成 的 能 力 是 一 个 重要 
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的 特性 并 且 不 浪费 任何 事情 。 因 此 你 需要 设计 你 的 代码 来 使 用 这 个 特性 一 一 当知 道 结果 
的 时 候 用 一 些 方式 中 断 别 的 任务 ， 因 此 代码 不 需要 等 待 别 的 工作 线程 处 理 剩 下 的 元 素 。 

如 果 你 不 中 断 别 的 线程 ， 串 行 版 本 比 并 行 版 本 的 性 能 更 好 ， 因 为 串 行 算法 一 旦 找到 
匹配 项 就 停止 搜索 并 且 返 回 。 例 如 ， 如 果 系 统 可 以 支持 四 个 并 发 线程 ， 每 个 线程 将 检查 
范围 内 四 分 之 一 的 元 素 ,并 且 我 们 的 并 行 算法 大 约 花费 单个 线程 四 分 之 一 的 时 间 来 检查 
每 个 元 素 。 如 果 匹 配 的 元 素 位 于 范围 内 的 前 四 分 之 一 ， 串 行 算法 会 首先 返回 ， 因 为 它 不 
需要 检查 剩 下 的 元 素 。 

你 可 以 中 断 别 的 线程 ， 一 种 方法 是 通过 使 用 一 个 原子 变量 作为 一 个 标志 ， 并 且 在 处 
理 完 每 个 元 素 后 检查 这 个 标志 。 如 果 设置 了 标志 ， 就 代表 有 一 个 线程 发 现 了 匹配 项 ， 因 
此 就 可 以 终止 执行 并 且 返 回 了 。 用 这 种 方法 中 断 别 的 线程 ， 你 保持 了 你 不 需要 处 理 每 个 
值 的 特性 ， 因 此 在 更 多 的 情况 下 与 串 行 版 本 相 比 提高 了 性 能 。 这 种 方法 的 缺点 是 原子 载 
入 变 成 慢 动作 ， 这 就 会 妨碍 每 个 线程 的 前 进 。 

关于 如 何 返回 值 和 如 何 传递 异常 你 有 两 个 选择 。 你 可 以 使 用 future 数组 ,使 用 
std::packaged task 来 转移 值 和 有 异常， 然后 在 主线 程 中 处 理 返回 的 结果 ;， 或 者 你 使 
用 std: :promise 来 从 工作 线程 中 直接 设置 最 终结 果 。 如 果 你 希望 在 第 一 个 异常 处 停 
止 ( 即 使 你 没有 处 理 完 所 有 元 素 )， 你 可 以 使 用 std: :promise 来 设置 值 和 异常 。 另 一 
方面 ， 如 果 你 希望 允许 别 的 工作 线程 继续 搜索 ， 你 可 以 使 用 std: :packaged task, 
存储 所 有 的 异常 ， 那 么 没有 发 现 匹配 项 的 时 候 就 重新 抛 出 其 中 之 一 。 

在 这 种 情况 下 ， 我 选择 使 用 std: :Promise， 因 为 行为 更 匹配 std: : find。 这 里 
要 注意 的 一 件 事情 就 是 要 搜索 的 元 素 不 在 提供 的 范围 内 。 因 此 在 从 future 得 到 结果 之 前 
你 需要 等 待 所 有 线程 结束 。 如 果 你 在 future 上 阻塞 了 并 且 没 有 这 个 值 的 话 ， 你 就 会 永远 
等 待 。 结 果 如 清单 8.9 所 示 。 


清单 8.9 并 行 find 算法 的 一 种 实现 


template<typename Iterator,typename MatchType> 
Iterator parallel find(Iterator first,Iterator last,MatchType match) 


struct find element +@ 

void operator() (Iterator begin, Iterator end, 
MatchType match, 
std: :promise<Iterator>* result, 
std: :atomic<bool>* done flag) 


try 


{ 
for(; (begin!=end) && !done_flag->load() ;++begin) +O 


{ 


if (*begin==match) 
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result-»set value (begin); < 二 四 
done flag-»store (true); 0 
return; 


try 

{ 
result-»set exception(std::current exception()); +@ 
done flag-»store (true); 

) 


catch ti. +@ 
{} 


i 
unsigned long const length=std::distance (first, last) ; 


if (!length) 
return last; 


unsigned long const min_per_thread=25; 
unsigned long const max_threads= 
(length«min per thread-1)/min per thread; 


unsigned long const hardware threads- 
std::thread::hardware concurrency(); 


unsigned long const num threads- 
std::min(hardware threads!-0?hardware threads:2,max threads); 


unsigned long const block size-length/num threads; 


Std::promisecIterator» result; 0 
std::atomic«bool» done flag(false); 0 
std::vector<std::thread> threads (num threads-1); 


{ 
join threads joiner (threads) ; 由 


Iterator block start-first; 
for (unsigned long i-0;i«(num threads-1) ;++1) 
{ 

Iterator block_end=block_start; 

std: :advance (block_end, block_size) ; 


threads [i] =std::thread(find_element (), -+O 
block start,block end,match, 
&result, &done flag); 

block start-block end; 


} 

find element () (block start,last,match,&result,&done flag); «-p 
} 
if (!done_flag.load()) Ð 


{ 


return last; 
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return result.get future().get(); < 


) 


清单 8.9 的 主 函 数 与 之 前 的 例子 很 相似 。 这 次 ， 在 本 地 find element 类 的 函数 
调用 操作 上 完成 工作 @。 这 个 循环 访问 给 定 的 块 的 每 个 元 素 , 每 一 步 都 检查 标志 e. tu 
果 找 到 匹配 项 , 就 在 promise 中 设置 最 后 的 结果 © 并 且 在 返回 前 设置 done_f1ag@。 

如 果 抛 出 异常 ， 就 可 以 被 捕获 O, HEERE done_flag 前 在 promise 中 存储 
异常 @。 如 果 promise 已 经 被 设置 了 ， 再 设置 值 就 有 可 能 抛 出 异常 ， 因 此 你 捕获 并 且 
抛弃 发 生 在 这 里 的 异常 @。 

这 就 意味 着 如 果 一 个 线程 调用 find_element， 要 么 找到 匹配 项 要 么 抛 出 异常 ， 
此 时 所 有 别 的 线程 都 会 看 到 done flag 被 设置 了 并 且 停 止 执 行 。 如 果 多 个 线程 同时 找 
到 匹配 项 或 者 抛 出 异常 ， 它 们 就 会 在 设置 promise 值 的 时 候 产生 竞争 。 但 是 这 是 一 个 
没有 危害 的 竞争 条 件 ， 无论 哪 一 个 线程 成 功 都 会 成 为 名 义 上 的 “第 一 个 ”并 且 是 一 个 可 
接受 的 结果 。 

回顾 主 函数 parallel find 本 身 , 你 用 promise@ 和 fla9g@ 来 停止 搜索 , 这 两 
者 都 传递 给 在 这 个 范围 内 搜索 的 新 线程 镶 。 主 线程 也 使 用 find element 来 搜索 剩 下 
的 元 素 @。 我 们 已 经 说 过 ， 你 在 检查 结果 之 前 需要 等 待 所 有 线程 结束 ， 因 为 可 能 没有 匹 
配 的 元 素 。 你 通过 在 块 中 附和 线程 连接 的 代码 来 完成 @， 因 此 当 你 检查 标志 来 看 看 是 否 
发 现 匹配 项 的 时 候 ， 所 有 线程 都 被 联合 起 来 了 四 。 如 果 发 现 匹 配 项 ， 你 就 可 以 通过 在 
std: :future<iterator> 中 调用 get () 得 到 结果 或 者 抛 出 存储 的 异常 @。 

同样 ,这 个 实现 假设 你 将 使 用 所 有 可 获得 的 硬件 线程 或 者 你 有 别 的 方法 来 决定 线程 
数量 ， 用 来 提前 在 线程 间 划 分 工作 。 跟 以 前 一 样 ， 在 使 用 C++ 标准 库 的 自动 扩展 功能 的 
时 候 ， 你 可 以 使 用 std: :async 和 递归 数据 划分 来 简化 你 的 实现 。 使 用 std: :async 
的 Parallel find 实现 如 清单 8.10 所 示 。 


清单 8.10 使 用 std::async 的 并 行 查找 算法 的 实现 


template<typename Iterator,typename MatchType> 

Iterator parallel find impl(Iterator first,Iterator last,MatchType match, 
std: :atomic<bool>& done) 

{ 


try. 
{ 
unsigned long const length=std::distance(first,last) ; 
unsigned long const min_per_thread=25; 
if(length«(2*min per thread)) ' 
{ 
for(; (first!=last) && !done.load() ;++first) 0 


{ 


if (*first==match) 
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done-true; 
return first; 
) 
) 
return last; +@ 
} 


else 
{ 
Iterator const mid point-first« (length/2); +@ 
std::future<Iterator> async_result= 
std::async(&parallel find impl«Iterator,MatchType», 
mid point,last,match,std::ref (done) ) ; 
Iterator const direct_result= 
parallel find impl(first,mid point,match,done); 
return (direct result--mid point)? 


ó ò 


async result.get():direct result; <Q 
} 
} 
(二 
{ 
done=true; +O 
throw; 


} 
} 


template<typename Iterator,typename MatchType> 


Iterator parallel_find(Iterator first,Iterator last,MatchType match) 


std::atomic<bool> done (false); 
return parallel find impl(first,last,match,done); +O 


} 


如 果 你 找到 匹配 项 就 结束 查找 ， 意 味 着 你 需要 引入 一 个 在 线程 间 共 享 的 标志 ， 用 来 
表示 已 经 找到 该 匹配 项 。 因 此 这 就 需要 传递 给 所 有 递归 调用 。 实 现 它 最 简单 的 方法 就 是 
通过 在 实现 函数 上 © 附加 参数 一 一 引用 done 标志 ， 这 是 从 主人 口 点 传递 进来 的 @。 

核心 实现 在 类 似 的 代码 行 里 继续 执行 。 与 很 多 实现 相同 ， 你 在 单线 程 上 设置 处 理 项 
的 最 小 值 @。 如 果 你 不 能 将 它 划 分 为 都 至 少 达 到 设置 的 大 小 的 两 部 分 , 就 在 当前 线程 上 
运行 所 有 的 事情 @。 实 际 算法 是 处 理 具体 范围 的 简单 循环 , 一 直 循 环 直 到 范围 结束 或 者 
设置 了 done 标志 @。 如 果 你 查找 到 匹配 项 ,就 在 返回 前 设置 done 标志 ©, MARIE 
止 查找 ， 要 么 因为 你 已 经 到 达 范围 的 末端 ， 要 么 因为 另 一 个 线程 设置 了 done 标志 。 你 
返回 last 用 来 表示 在 这 里 没有 匹配 项 @ 。 

如 果 范围 可 以 被 划分 ， 你 在 使 用 std::async 前 首先 发 现 中 点 @， 以 便 在 范围 的 
后 半 部 分 进行 查找 @， 小心 使 用 sta: : ref 来 传递 done 标志 的 引用 。 同 时 ， 你 可 以 通 
过 直接 递归 调用 在 范围 的 前 半 部 分 进行 查找 @。 如 果 原 来 的 范围 太 大 的 话 ， 这 个 异步 调 
用 和 直接 递归 可 能 导致 进一步 的 划分 。 

如 果 直 接 搜索 返回 mid_point， 那 么 就 没有 找到 匹配 项 ， 你 就 需要 得 到 异步 搜索 
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的 结果 。 如 果 那 部 分 没有 发 现 结果 ， 结 果 就 将 是 1ast， 这 是 正确 的 返回 值 表 明 没 有 查 
找到 这 个 值 @。 如 果 “ 蜡 步 的 ”调用 被 延迟 而 不 是 真正 的 异步 ， 它 在 调用 get O 的 时 候 
才 真 正 运行 ,在 这 种 情况 下 ， 如 果 在 后 半 部 分 查找 到 了 就 跳 过 搜索 范围 的 前 半 部 分 。 如 
果 蜡 步 搜 索 已 经 在 另 一 个 线程 上 运行 了 ，async_result 变量 的 析 构 函数 将 等 待 线程 
完成 。 这 样 就 不 会 有 任何 泄露 线程 。 

如 同 以 前 一 样 ,使 用 std::async 提供 了 蜡 常安 全 和 异常 传递 特性 。 如 果 直 接 递 
归 抛 出 异常 ，future 的 析 构 函数 将 确保 运行 异步 调用 的 线程 在 函数 返回 前 就 结束 了 。 并 
且 如 果 异 步调 用 抛 出 异常 ， 这 个 异常 就 通过 get () 调用 传递 @。 使 用 一 个 try/catch 
块 是 为 了 在 异常 上 设置 done 标志 并 且 确 保 如 果 抛 出 异常 的 话 所 有 线程 很 快 终止 久 。 没 
有 它 ， 实 现 仍然 是 正确 的 ， 但 是 会 继续 检查 元 素 直到 每 个 线程 都 结束 了 。 

这 个 算法 的 两 种 实现 与 另 一 种 并 行 算法 共享 的 主要 特点 就 是 不 再 保证 项 目 按照 从 
std::find 得 到 的 顺序 来 处 理 。 如 果 你 想 并 行 算法 这 一 点 是 很 基础 的 。 如 果 顺 序 很 重 
要 的 话 ， 你 就 不 能 并 发 处 理 元 素 。 如 果 元 素 是 独立 的 ， 就 可 以 使 用 
parallel _for_each。 但 是 这 意味 着 你 的 parallel find 可 能 返回 范围 尾部 的 元 
素 ， 即 使 它 与 范围 头 部 的 元 素 匹配 。 

好 了 ， 你 已 经 处 理 了 并 行 化 std: :find。 正 如 我 在 这 一 节 开 头 说 的 那样 ， 存 在 别 
的 类 似 算 法 可 以 在 不 处 理 每 个 数据 元 素 的 情况 下 完成 ， 并 且 可 以 使 用 同样 的 方法 。 我 们 
将 在 第 9 章 中 进一步 讨论 中 断 线程 的 问题 。 

为 了 完成 我 们 的 例子 ,我们 将 从 不 同 的 方面 来 考虑 并 且 看 看 std: :partial_sum。 
这 个 算法 是 一 个 很 有 趣 的 并 行 算法 并 且 强 调 了 一 些 附 加 的 设计 选择 。 


8.5.3 std::partial sum 的 并 行 实 现 


std::partial sum 计算 了 一 个 范围 内 的 总 和 ， 因 此 每 个 元 素 都 被 这 个 元 素 与 它 
之 前 的 所 有 元 素 的 和 所 代替 。 所 以 序列 1、2、3、4、5 就 变 成 1、(1+2)=3、(1+2+3)=6、 
(1+2+3+4)=10、(1+2+3+4+5)=15。 它 的 并 行 化 是 很 有 趣 的 ， 因 为 你 不 能 将 范围 划分 为 块 
然后 单独 计算 每 个 块 。 例 如 ， 第 一 个 元 素 的 原始 值 需要 加 到 每 一 个 别 的 元 素 上 。 

一 种 用 来 决定 范围 内 部 分 和 的 方法 就 是 计算 独立 块 的 部 分 和 ， 然后 将 第 一 个 块 中 计 
算得 到 的 最 后 一 个 元 素 的 值 加 到 下 一 个 块 的 元 素 中 ， 并 以 此 类 推 。 如 果 你 有 元 素 
1,2,3,4,5,6,7,8,9 并 且 你 将 它 分 成 三 个 块 ， 首 先 你 得 到 {1,3,6}、{4,9,15}、{7,15,24}。 如 果 
你 将 6 加 到 第 二 个 块 的 所 有 元 素 上 ， 你 就 得 到 {1,3,6}、{10,15,21}、{7,15,24}。 然 后 你 
将 第 二 个 块 的 最 后 一 个 元 素 {21} 加 到 第 三 个 块 的 元 素 上 ， 这 样 最 后 一 个 块 得 到 最 后 的 
fH: (13,6), (10,1521), {28,36,55}. 

同 原 始 划分 成 块 一 样 ， 也 可 以 并 行 加 上 前 一 个 块 的 部 分 和 。 如 果 每 个 块 的 最 后 一 个 
元 素 首 先 被 更 新 ， 那 么 当 第 二 个 线程 更 新 下 一 个 块 的 时 候 ， 第 一 个 线程 可 以 更 新 这 个 块 
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中 剩 下 的 元 素 ， 并 且 以 此 类 推 。 当 列表 中 的 元 素 多 于 处 理 核 的 时 候 ， 这 种 方法 很 有 效 ， 
因为 每 个 核 每 一 步 都 要 处 理 大 量 元 素 。 

如 果 你 有 很 多 处 理 核 ( 同 元 素数 量 一 样 ， 或 者 多 于 元 素数 量 )， 这 种 方法 就 不 是 很 
有 效 了 。 如 果 你 在 处 理 器 间 划 分 工作 ， 第 一 步 以 元 素 对 结束 工作 。 这 这 种 条 件 下 ， 这 种 
进一步 传递 结果 意味 着 很 多 处 理 器 会 等 待 ， 因 此 你 需要 给 它们 分 配 工作 。 你 可 以 采用 男 
一 种 方法 对 待 这 个 问题 。 你 做 部 分 传递 ， 而 不 是 从 一 个 块 到 下 一 个 块 做 全 部 和 的 传递 。 
首先 像 之 前 一 样 求 和 相 邻 的 元 素 ， 然 后 将 这 些 和 加 到 与 它 相 隔 两 个 的 元 素 上 ， 然 后 再 将 
得 到 的 值 加 到 与 它 相隔 四 个 的 元 素 上 ， 以 此 类 推 。 如 果 你 以 同样 的 九 个 元 素 开 始 ， 第 一 
轮 后 你 得 到 1,3,5,7,9,11,13,15,17， 这 就 得 到 前 两 个 元 素 最 后 的 值 。 第 二 轮 后 你 得 到 
1.3,6,10,14,18,22,26,30, 它 的 前 四 个 元 素 是 正确 的 。 第 三 轮 后 你 得 到 1,3,6,10,15,21,18,36,44， 
它 的 前 八 个 元 素 是 正确 的 。 第 四 轮 后 你 得 到 1.3,6,10,15,21,18,36,45， 这 就 是 最 终 答案 。 尽 
管 它 比 第 一 种 方法 的 总 步 又 数 要 多 , 但 是 如 果 你 有 很 多 线程 的 话 , 它 有 更 大 的 余地 来 并 行 
化 ， 每 个 处 理 器 每 一 步 都 能 更 新 一 个 人 口 。 

总 的 说 来 ， 第 二 种 方法 执行 logx(V) 个 步 又， 每 一 个 步 又 执行 大 约 N 个 操作 (每 个 
线程 处 理 一 个 ) Kp N 是 表 中 的 元 素数 量 。 第 一 种 算法 中 ， 每 个 线程 为 分 配给 它 的 块 
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因此 从 总 的 操作 数 来 说 ， 第 一 种 方法 是 O(N), 第 二 种 方法 是 O(Nlog(N))。 尽 管 如 此 ， 如 
果 你 的 处 理 器 与 列表 中 的 元 素 一 样 多 ， 那么 第 二 种 方法 中 每 个 处 理 器 只 需要 log(V) 个 操 
作 。 而 当 大 很 大 时 ， 第 一 种 方法 本 质 上 是 串 行 操作 ， 因 为 需要 进一步 传递 值 。 对 于 拥有 
很 少 处 理 单元 的 系统 ， 第 一 种 方法 可 以 更 快 结束 ， 而 对 于 大 规模 并 行 系统 ， 第 二 种 方法 
可 以 更 快 结束 。8.2.1 节 讨 论 了 这 个 问题 的 一 个 极端 的 例子 。 

无 论 如 何 , 先 不 考虑 效率 问题 , 我 们 来 看 一 些 代码 。 清单 8.11 所 示 的 是 第 一 种 方法 。 


清单 8.11 ”通过 划分 问题 来 并 行 计算 分 段 的 和 
template<typename Iterator> 
void parallel partial sum(Iterator first,Iterator last) 


{ 


typedef typename Iterator::value_type value_type; 
struct process chunk +@ 


void operator() (Iterator begin, Iterator last, 
std: :future<value_type>* previous end value, 
std::promise«value type»* end value) 
{ 
try 
{ 
Iterator end=last; 
++end; 
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Std::partial sum(begin,end,begin); 0 

if (previous_end_value) -© 

{ 
value type& addend-previous end value-»get () ; 0 
*last+=addend; 
if (end_value) P 


{ 
} 
std::for_each(begin, last, [addend] (value_type& item) <Q 


( 
p: 


end value-»set value(*last); +@ 


item+=addend; 


} 


else if (end_value) 


{ 
} 
catch(...) 0 
{ 


end_value->set_value (*last) ; 0 


if (end_value) 


{ 
} 
else 


{ 
} 


end_value->set_exception(std: :current_exception()) ; < 


throw; «—p 


): 
unsigned long const length=std::distance(first,last) ; 


if(!length) 
return last; 


unsigned long const min per thread-25; «-p 
unsigned long const max threads- 
(length«min per thread-1)/min per thread; 


unsigned long const hardware threads- 
Std::thread::hardware concurrency(); 


unsigned long const num threads- 
Std::min(hardware threads!-0?hardware threads:2,max threads); 


unsigned long const block size-length/num threads; 


typedef typename Iterator::value type value type; 


Std::vector«std::thread» threads (num threads-1); «—D 
Std::vector«std::promise«cvalue type» > 
end values (num threads-1); «D 


Std::vector«std::future«value type» > 
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previous end values; 
previous end values.reserve (num threads-1); < 
join threads joiner (threads) ; 


Iterator block_start=first; 


for (unsigned long i=0;i<(num_threads-1) ; ++i) 


Iterator block_last=block_start; 
Std::advance(block last,block size-1); «p 
threads [i] =std::thread(process_chunk(), 
block start,block last, 
(i!-0)?&previous end values[i-1]:0, 
&end values[il); 
block start-block last; 
*«block start; 
previous end values.push back(end values[i].get future()); <A) 
) 
Iterator final element-block start; 
std::advance(final_element, std: :distance (block start,last)-1); A) 
process_chunk () (block_start,final_element, -+ 人 © 
(num threads»1)?&previous end values.back():0, 
0) ; 


) 


在 这 个 例子 中 ,总 体 结构 与 之 前 的 代码 是 一 样 的 ， 划 分 问题 为 块 ， 每 个 线程 拥有 最 
小 化 的 块 尺寸 四 。 在 这 种 情况 下 ,与 线程 向 量 一 样 @， 你 有 一 个 promise 向 量 @@ 用 来 存储 
块 中 最 后 一 个 元 素 的 值 , 并且 还 有 一 个 future HRO, 用 来 得 到 前 一 个 块 的 最 后 一 个 值 。 
你 可 以 保留 future 的 空间 @ 来 避免 在 生成 线程 的 时 候 再 分 配 , 因为 你 知道 将 有 多 少 线程 。 

主 循环 与 以 前 的 一 样 ， 只 是 这 次 你 希望 迭代 器 指向 每 个 块 中 的 最 后 一 个 元 素 本 身 ， 而 不 是 
通常 情况 下 那样 指向 最 后 元 素 的 后 继 @， 因 此 在 每 个 范围 你 都 可 以 传递 最 后 一 个 元 素 。 真 正 的 
处 理 是 在 process chunk 函数 对 象 中 完成 的 ， 我 们 稍 后 再 分 析 。 需 要 给 的 参数 包括 这 个 块 
的 开始 和 结束 的 迭代 器 ， 先 前 范围 的 终 值 (如果 存在 的 话 ) ， 这 个 范围 的 终 值 存放 的 位 置 @。 

产生 线程 后 ， 你 就 可 以 更 新 这 个 块 的 起 点 ， 记 住 将 它 的 值 加 一 使 它 位 于 最 后 一 个 元 
素 之 后 外， 并 且 将 当前 块 的 最 后 一 个 值 的 future 存储 到 future 向 量 中 ， 这 样 下 一 次 循环 
的 时 候 就 可 以 得 到 它 国 。 

在 你 处 理 最 后 一 个 块 之 前 ， 你 需要 得 到 最 后 一 个 元 素 的 迭代 器 贺 ， 这 样 你 就 可 以 传 
弟 到 process chunk 中 国 。stqd: :partial _sum 不 返回 值 ， 因 此 一 旦 最 后 一 个 块 被 
处 理 了 ， 你 不 需要 做 任何 操作 。 当 所 有 线程 结束 的 时 候 这 个 操作 就 完成 了 。 

现在 我 们 来 看 看 process chunk 函数 对 象 在 整个 工作 中 所 起 的 作用 @。 首 先 在 
整个 块 上 调用 std::partial sum, 包括 最 后 一 个 元 素 ©, 但 是 然后 就 需要 知道 这 是 
否 为 第 一 个 块 ©, 如 果 这 不 是 第 一 个 块 , 那么 在 先前 块 中 就 有 previous_end value, 
因此 你 就 需要 等 待 这 个 值 @。 为 了 最 大 化 算法 的 并 发 性 ,你 就 需要 首先 更 新 最 后 一 个 元 
x @， 因 此 你 将 值 传递 给 下 一 个 块 (如果 存 在 的 话 ) ©, 一 旦 完成 了 这 些 操作 ， 你 就 可 
以 使 用 std::for_each 和 一 个 简单 的 lambda 函数 @ 来 更 新 这 个 范围 内 剩 下 的 元 素 。 
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如 果 没 有 previous_end_value， 那 么 这 就 是 第 一 个 块 ， 因 此 你 可 以 只 更 新 下 一 
个 块 的 end_value () (同样 ， 如 果 存 在 下 一 个 块 的 话 一 一 这 可 能 是 仅 有 的 块 ) ©, 

最 后 ， 如 果 任 何 操 作 抛 出 异常 ， 你 捕捉 到 它 @ 并 且 将 它 存储 在 promise 中 @。 这 样 
当 它 试图 得 到 先前 的 最 后 一 个 值 的 时 候 就 会 传递 给 下 一 个 块 了 @。 这 会 将 所 有 的 异常 都 
传递 给 最 后 一 个 块 ， 然 后 被 重新 抛 出 镶 ， 因 为 你 知道 这 是 运行 在 主线 程 上 。 

因为 线程 间 的 同步 ， 这 段 代 码 就 不 容易 控制 与 std::async 一 起 重 写 。 等 待 结果 
的 任务 中 途 通 过 别 的 任务 的 执行 ， 因 此 所 有 任务 都 必须 同时 运行 。 

使 用 基于 块 ， 向 前 传输 的 方法 是 很 少见 的 ， 证 我 们 来 看 看 计算 范围 内 部 分 和 的 第 二 
种 方法 。 


为 部 分 求 和 实现 增 量 对 偶 算 法 


当 你 的 处 理 器 可 以 按部就班 地 执行 加 法 , 通过 累加 越 来 越 远 的 元 素来 计算 部 分 和 的 
方法 可 以 工作 得 很 好 。 在 这 种 情况 下 ， 不 需要 进一步 的 同步 ， 因 为 所 有 中 间 结 果 都 会 直 
接 传 递 给 下 一 个 需要 它们 的 处 理 器 。 但 是 实际 上 ， 你 很 少 可 以 在 这 样 的 系统 上 工作 ， 除 
非 你 的 系统 支持 少量 数据 元 素 上 同时 执行 操作 的 指令 ， 即 所 谓 的 单 指令 /多 数据 
(Single-Instruction/Multiple-Data，SIMD) 指 令 。 因 此 ， 你 必须 为 通常 情况 设计 代码 并 且 
每 一 步 都 明确 地 同步 线程 。 

一 种 方法 是 使 用 屏障 (barrier) 一 一 一 种 同步 方法 使 得 线程 等 待 直到 要 求 的 线程 已 
经 到 达 了 屏障 。 一 旦 所 有 线程 到 达 屏 障 ， 它 们 就 可 以 继续 执行 而 不 阻塞 了 。C++11 线程 
库 没 有 直接 提供 这 样 的 工具 ， 因 此 你 需要 自己 设计 。 

想象 一 下 游乐 园 里 的 过 山 车 。 如 果 有 合适 数量 的 人 在 等 待 ， 游 乐园 职员 就 会 确保 在 
过 山 车 离开 平台 之 前 每 个 座位 都 有 人 。 屏障 的 工作 原理 也 是 一 样 的 , 你 提前 指定 “座位 ” 
的 数量 ， 并 且 线 程 必须 等 待 直到 所 有 “座位 ”都 是 满 的 。 一 旦 有 足够 的 等 待 线程 ， 就 可 
以 继续 执行 ， 屏障 被 重 置 并 且 开 始 等 待 下 一 批 线程 。 通 常 ， 在 循环 中 使 用 此 构造 ， 在 那 
里 同一 线程 再 次 出 现 并 且 等 待 下 一 次 。 这 个 想法 是 为 了 使 线程 按部就班 地 工作 ， 因 此 一 
个 线程 不 会 在 别 的 线程 前 面 离开 以 及 掉队 。 对 于 这 个 算法 ， 这 就 会 造成 灾难 ， 因 为 离开 
的 线程 可 能 会 修改 别 的 线程 正在 使 用 的 数据 ， 或 者 使 用 还 没有 被 正确 更 新 的 数据 。 

无 论 如 何 ， 清 单 8.12 给 出 了 屏障 的 一 个 简单 实现 。 


清单 8.12 一 个 简单 的 屏障 类 


class barrier 
unsigned const count; 
Std::atomic«unsigned» spaces; 
Std::atomic«unsigned» generation; 


public: a 
explicit barrier(unsigned count_): 
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count (count ) , spaces (count) , generation (0) 


{} 


void wait () 


unsigned const my_generation=generation; 0 


if(!--spaces) 

l è 
Spaces-count; 0 
++generation; -© 

} 


else 


while (generation==my_generation) +@ 
std::this thread::yield(); +@ 
} 


ay 

Ja 

在 这 个 实现 中 ， 你 构造 了 一 个 parrier， 它 具有 一 定数 量 “座位 ”@， 存 储 在 count 
变量 中 。 最 初 ， 屏 障 中 spaces 的 数量 与 count 相等 。 当 每 个 线程 等 待 的 时 候 ，spaces 
的 数量 就 会 减 1@ 。 当 它 的 值 为 零 的 时 候 ，spaces 的 值 就 会 重 置 为 count@， 并 且 
generation 的 值 增 一 来 给 别 的 线程 发 信号 表示 它们 可 以 继续 执行 @。 如 果 空 闪 spaces 
的 数量 没有 达到 零 ， 你 就 必须 等 待 。 这 个 实现 使 用 一 种 简单 旋转 锁 @， 检 查 在 wait 0 FF 
始 的 时 候 得 到 的 值 。 因 为 当 所 有 线程 到 达 屏 障 的 时 候 才 会 更 新 generation 的 值 6, 等待 
的 时 候 调用 yield () @， 因 此 在 一 个 繁忙 的 等 待 中 ， 等 待 的 线程 不 会 独占 CPU, 

当 我 说 这 个 实现 是 简单 的 ， 我 的 意思 是 它 使 用 一 个 旋转 锁 ， 因 此 它 不 适合 线程 可 能 
等 待 很 长 时 间 的 情况 。 并 且 如 果 在 任何 一 个 时 间 有 多 于 count 数量 的 线程 可 能 调用 
wait () ， 那 么 它 就 不 起 作用 了 。 如 果 你 想 处 理 这 些 情况 中 的 任何 一 种 ， 你 就 必须 使 用 
一 个 更 健壮 性 (但 是 更 复杂 ) 的 实现 来 代替 。 我 遵循 了 在 原子 变量 上 的 顺序 连续 操作 ， 
因为 这 使 得 事情 更 容易 解释 ,但 是 你 可 以 放松 一 些 顺 序 约束 。 在 大 规模 并 发 结构 上 ， 这 
样 的 全 局 同步 是 代价 很 高 的 , 因为 缓存 线 持 有 屏障 的 状态 必须 在 所 有 涉及 到 的 线程 间 穿 
R (参见 8.2.2 节 ) ， 因 此 你 必须 注意 确保 在 这 里 这 是 最 好 的 选择 。 

无 论 如 何 ， 在 这 里 这 就 是 你 所 需要 的 ， 你 有 固定 数量 的 线程 在 循规蹈矩 的 循环 中 运 
行 。 当 然 ， 这 只 是 几乎 固定 数量 的 线程 。 你 可 能 记得 ， 在 一 些 步 又 后 ， 列 表 开 始 的 项 获 
得 它 的 最 终 值 。 这 就 意味 着 要 么 你 保持 这 些 线程 循环 直到 处 理 完整 个 范围 ， 要 么 你 需要 
允许 屏障 处 理 线程 退出 并 且 减 少 count 。 我 倾向 于 后 面 一 种 选择 , 因为 它 避免 了 使 线程 
只 是 循环 而 不 做 任何 有 用 的 工作 直到 最 后 一 步 完 成 。 

这 就 意味 着 你 需要 将 count 变 成 一 个 原子 变量 ， 因 此 你 可 以 从 多 个 线程 更 新 它 而 
不 需要 额外 的 同步 。 


Std::atomic«unsigned» count; 


它 的 初始 化 是 一 样 的 ,但 是 现在 当 你 重 置 spaces 的 值 的 时 候 就 必须 明确 在 count 
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中 Loadq() 。 


Spaces-count.load(); 


这 些 都 是 在 wait () 上 所 做 的 改变 ， 现 在 你 需要 一 个 新 的 成 员 函 数 来 减少 count, 
我 们 称 之 为 done_waiting () ， 因 为 一 个 线程 声称 在 等 待 的 时 候 完 成 它 。 


void done waiting() 


{ 


-s00unt; 0 
if(!--spaces) +O 
{ 
spaces=count.load(); «e 
++generation; 
} 
} 


你 做 的 第 一 件 事 是 递减 count 的 值 @， 这 样 下 一 次 重 置 spaces 就 反映 新 的 等 待 
线程 的 数量 。 然 后 你 需要 将 空闲 spaces 的 数目 递减 @。 如 果 不 这 么 做 , 别 的 线程 就 会 
永远 等 待 , 因为 spaces 被 初始 化 为 旧 的 , 更 大 的 值 。 如 果 这 是 分 支 上 的 最 后 一 个 线程 ， 
你 就 需要 重 置 counter 并 且 增 加 generation@， 就 如 你 在 wait O 中 所 做 的 那样 。 
在 完成 所 有 的 等 待 后 就 结束 了 。 

现在 你 准备 好 写 部 分 和 的 第 二 种 实现 了 ,在 每 一 步 ,每 个 线程 在 屏障 上 调用 wait () 
来 保证 线程 步 又 一 起 , 并 且 一 旦 每 个 线程 都 完成 了 , 就 在 屏障 上 调用 done waiting () 
来 减少 count。 如 果 你 在 初始 范围 内 使 用 第 二 个 缓冲 器 ,屏障 提供 你 所 需要 的 所 有 同步 。 
在 每 一 步 中 ， 线 程 从 原先 的 范围 或 者 缓冲 器 中 读 取 ， 并 且 将 新 值 写 人 相关 元 素 中 。 如 果 
线程 在 一 个 步骤 中 读 取 了 原先 的 范围 ， 它 们 在 下 一 个 步 又 中 读 取 缓 冲 器 ， 反 之 亦 然 。 这 
就 确保 了 在 不 同 线程 的 读 取 和 写 操作 中 没有 竞争 条 件 。 一 旦 一 个 线程 结束 循环 ， 它 必须 
确保 正确 的 最 终 值 被 写 人 最 初 的 范围 中 。 清 单 8.13 给 出 了 所 有 的 操作 。 


清单 8.13 ”通过 成 对 更 新 的 partial sum 的 并 行 实现 
struct barrier 


( 


Std::atomic«unsigned» count; 
std::atomic<unsigned> spaces; 
std::atomic«unsigned» generation; 


barrier(unsigned count ): 
count (count ),spaces(count ),generation(0) 


void wait() 

( 
unsigned const gen-generation.load(); 
if(!--spaces) 


{ 


) 
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spaces-count.load(); 
++generation; 


} 


else 


{ 


while (generation. load() ==gen) 


{ 
} 


std::this_thread: :yield() ; 


void done waiting() 


{ 


yi 


«count; 

if(!--spaces) 
spaces=count.load() ; 
++generation; 


template<typename Iterator> 
void parallel_partial_sum(Iterator first,Iterator last) 


{ 


typedef typename Iterator::value_type value_type; 


struct process_element +@ 


{ 


void operator() (Iterator first,Iterator last, 


std: :vector<value_type>& buffer, 


unsigned i,barrier& b) 


value type& ith_element=* (first«i); 
bool update source-false; 


for (unsigned step=0,stride=1;stride<=i;++step, stride*=2) 


{ 
value type const& source- (step$2)? 
buffer[i]:ith element; 
value type& dest=(step%2) ? 
ith element:buffer[i]; 
value type const& addend- (step$2)? 


—0 


-© 


buffer[i-stride]:*(first«i-stride); 


dest=source+addend; 0 
update_source=! (step%2) ; 
b.wait(); 

} 

if(update source) +@ 

{ 


} 
b.done_waiting() ; <Q 


ith element-buffer[i]; 
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unsigned long const length-std::distance(first,last); 


if (length<=1) 
return; 


Std::vector«value type» buffer (length); 
barrier b(length); 


Std::vector«std::thread» threads (length-1); 0 
join_threads joiner (threads); 


Iterator block startsfirst; 


for (unsigned long i=0;i<(length-1) ; ++i) 


threads [i]=std::thread (process element (),first,last, 0 
std::ref(buffer),i,std::ref(b)); 
) 


process element () (first,last,buffer,length-1,b); +O 


现在 你 已 经 很 熟悉 这 段 代码 的 总 体 结构 了 。 你 用 一 个 拥有 函数 调用 操作 的 类 
(process element) 来 做 这 个 工作 @， 你 在 存储 在 向 量 中 @ 的 一 些 线程 @ 上 运行 它 
并 且 在 主线 程 调用 它 @。 这 次 的 主要 不 同 之 处 在 于 线程 数量 取决 于 列表 中 项 的 数量 而 不 
是 取决 于 std: :thread: :hardware_concurrency。 正 如 我 所 说 ， 除 非 你 是 在 一 个 
线程 很 便宜 的 大 量 并 行 机 器 上 运行 ， 这 不 是 一 个 好 方法 ， 但 是 它 显 示 了 总 体 结构 。 也 可 
以 用 较 少 的 线程 ， 每 个 线程 处 理 源 范围 的 多 个 值 。 但 是 这 也 会 出 现 一 个 问题 ， 那 就 是 有 
足够 少 的 线程 使 得 它 比 向 前 传输 算法 的 效率 还 要 低 。 

无 论 如 何 ,， 在 Process_element 函数 调用 操作 中 完成 了 关键 工作 。 每 一 步 你 要 么 从 
原先 的 范围 得 到 第 i 个 元 素 要 人 么 从 缓冲 器 得 到 第 i 个 元 素 @, 并 且 将 它 添加 到 stride 元 素 
的 值 中 @， 如 果 从 原先 的 范围 开始 就 将 它 存储 在 缓冲 器 中 ， 或 者 如 果 从 缓冲 器 开始 就 存储 
在 原先 的 范围 中 @。 然 后 在 开始 下 一 步 之 前 你 在 屏障 上 等 待 @。 当 stride 使 你 离开 范围 
的 起 点 时 你 就 完成 操作 了 。 在 这 种 情况 下， 如果 你 的 最 终结 果 存 储 在 缓冲 器 中 的 话 ， 就 更 
新 原先 范围 里 的 元 素 @。 最 后 ， 你 告诉 屏障 你 正在 done waiting () 9, 

注意 这 种 情况 不 是 异常 安全 的 。 如 果 一 个 工作 线程 在 process element 上 抛 出 
异常 ， 就 会 终止 此 引用 。 你 可 以 使 用 std: :promise 存储 异常 来 处 理 这 种 情况 ， 正 如 
你 在 清单 8.9 的 parallel find 实现 中 所 做 的 一 样 ， 或 者 使 用 互 斥 元 保护 的 
stdrsexception ptr, 

这 总 结 了 我 们 的 三 个 例子 ， 希望 它们 有 助 于 具体 化 8.1，8.2 和 8.3 中 强调 的 设计 考 
虑 ， 并 且 证 明 在 真实 代码 中 可 以 使 用 这 些 方法 。 


86 总 结 
本 章 我 们 涉及 很 多 基础 知识 。 我 们 从 在 线程 间 划分 工作 的 多 种 方法 开始 ， 如 提前 划 


8.6 总 结 257 


分 数据 或 者 使 用 许多 线程 来 形成 管道 。 然 后 我 们 从 低 水 平角 度 考虑 与 多 线程 代码 的 性 能 
紧密 相关 的 问题 ， 在 转移 到 数据 读 取 是 如 何 影响 代码 性 能 之 前 考虑 了 假 共享 和 数据 竞争 
问题。 然后 我 们 考虑 了 设计 并 发 代码 时 候 要 考虑 的 问题 , 如 异常 安全 和 可 扩展 性 。 最后， 
我 们 以 一 些 并 发 算法 实现 的 例子 作为 结束 ， 每 一 个 例子 都 强调 了 当 设 计 多 线程 代码 时 可 
能 出 现 的 具体 问题 。 

本 章 出 现 几 次 的 一 个 事情 就 是 线程 池 的 想法 一 一 一 组 事先 配置 的 线程 运行 分 配给 
线程 池 的 任务 。 很 多 想法 被 用 在 设计 一 个 好 的 线程 池上 ， 因 此 下 一 章 我 们 将 考虑 一 些 问 
题 ， 以 及 高 级 线程 管理 的 别 的 方面 。 


在 之 前 的 章节 中 ， 我 们 通过 为 每 个 线程 创建 std: :thzead 对 象 来 显 式 管理 线程 。 
在 一 些 应 用 场合 ， 你 会 发 现 这 不 是 你 所 需要 的 ， 因 为 你 必须 管理 线程 对 象 的 生命 周期 ， 
决定 适合 问题 和 硬件 的 线程 数量 等 。 一 个 理想 的 方案 是 ， 你 只 需要 将 代码 划分 可 以 被 并 
发 执行 的 若干 小 片 ， 将 他 们 传递 给 编译 器 和 运行 库 ， 然 后 告诉 编译 器 “并 行 化 这 些 代码 
来 得 到 较 优 的 性 能 ”。 

另外 一 个 反复 出 现 的 场景 是 你 可 能 使 用 几 个 线程 来 求解 一 个 问题 ， 但 是 要 求 它 
们 在 满足 一 定 条 件 的 时 候 提 前 结束 。 这 有 可 能 是 因为 结果 已 经 被 求解 出 来 ， 或 者 因 
为 有 错误 发 生 ， 甚 至 是 因为 用 户 显 式 要 求 操作 被 放弃 。 不 管 什 么 原因 ， 线 程 需要 被 
发 送 “ 请 停止 ”信号 ， 这 样 它们 可 以 放弃 赋予 它们 的 任务 ， 尽 快 的 清理 自己 的 环境 ， 
然后 停止 运行 。 

在 本 章 中 , 我 们 会 从 自动 管理 线程 数量 和 线程 之 间 的 任务 划分 开始 介绍 管理 线程 和 
任务 的 机 制 。 
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线程 池 


在 许多 公司 ， 员 工 通常 在 办 公 室 上 班 。 但 是 有 时 候 员工 需要 出 差 去 访问 客户 或 者 供 

应 商 ， 参 加 一 个 交易 展览 或 者 会 议 。 虽 然 这 些 出 差 是 必须 的 ， 并 且 在 某 些 天 有 好 几 个 人 
同时 需要 出 差 ， 但 是 对 于 具体 某 个 员工 来 说 ， 不 同 出 差 的 时 间 间 隔 可 能 是 几 个 月 甚至 几 
年 。 为 每 个 员工 都 配置 一 辆 车 是 非常 昂贵 的 或 者 不 切实 际 的 ， 因 此 公司 通常 都 提供 一 个 
汽车 池 。 汽 车 池 有 一 定数 量 的 汽车 ， 供 公司 的 所 有 员工 出 差 使 用 。 当 公司 的 员工 需要 出 
差 时 ， 他 们 在 合适 的 时 间 向 汽车 池 申 请 一 辆 汽车 。 当 出 差 回 来 的 时 候 ， 员 工 将 汽车 归还 
给 汽车 地。 如果 汽车 池 中 没有 可 用 的 汽车 ， 员 工 需要 重新 规划 自己 出 差 的 行程 。 
”线程 池 是 一 个 类 似 的 思想 , 不 过 其 中 共享 的 是 线程 而 不 是 汽车 。 在 大 多 数 系 统 上 面 ， 
为 每 个 可 以 与 其 他 任务 并 行 执行 的 任务 分 配 一 个 单独 的 线程 是 不 切实 际 的 。 但 是 可 以 尽 
量 充分 利用 硬件 提供 的 并 发 性 。 线 程 池 人 允许 你 利用 这 一 点 。 可 以 被 并 发 执行 的 任务 被 提 
交 到 线程 池 中 ， 在 线程 池 中 被 放 人 一 个 等 待 队 列 。 每 个 任务 会 被 某 个 工作 线程 从 等 待 队 
中 取出 来 执行 。 工 作 线程 的 任务 就 是 当空 闲 的 时 候 从 等 待 队 中 取出 任务 来 执行 。 

建立 一 个 线程 池 有 几 个 关键 设计 问题 ， 比 如 在 线程 池 中 创建 几 个 工作 线程 ， 将 任务 
高 效 分 配给 工作 线程 的 方法 以 及 是 否 可 以 等 待 某 个 任务 的 完成 等 。 在 这 个 小 节 中 ,我 们 
会 提出 一 些 实现 来 解决 这 些 问题 ， 我 们 将 从 最 简单 的 线程 池 开 始 。 


最 简单 的 线程 池 


线程 池 最 简单 的 形式 是 含有 一 个 固定 数量 的 工作 线程 (典型 的 数量 是 
std::thread::hardware concurrency O 的 返回 值 ) 来 处 理 任务 。 当 有 任务 要 处 
理 的 时 候 , 调用 一 个 函数 将 任务 放 到 等 待 队 列 中 。 每 个 工作 线程 都 是 从 该 队列 中 取出 任 
4. 执行 完 任务 之 后 继续 从 等 待 队 列 取出 更 多 的 任务 来 处 理 。 在 最 简单 的 情况 ， 没 有 办 
法 来 等 待 一 个 任务 完成 。 如 果 需 要 有 这 样 的 功能 ， 则 需要 用 户 自己 维护 同步 。 

清单 9.1 给 出 了 一 个 最 简单 的 线程 池 的 示例 实现 。 


清单 9.1 简单 的 线程 池 


class thread pool 
{ 
std::atomic_bool done; 
thread safe queue«std::function«void()» > work queue; 0 
std::vector<std::thread> threads; 
join threads joiner; 


void worker thread() 


( 
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while (!done) 0 
{ 


std: :function<void()> task; 


if (work_queue.try_pop (task) ) 0 
{ 
task (); 0 
else 
{ 
std::this thread::yield(); «9 


) 
) 


public: 
thread pool(): 
done (false) , joiner (threads) 
{ 


unsigned const thread count-std::thread::hardware concurrency(); Mo. 


try 


( 


for (unsigned i=0;i<thread_count;++i) 


{ 


threads.push back( 


Std::thread(&thread pool::worker thread,this)); 0 
) 
) 
CACONI el) 
{ 
done=true; +O 
throw; 
} 
) 
-thread pool () 
{ 
done=true; <D 


) 


template<typename FunctionType> 
void submit (FunctionType f) 


{ 
} 


work_queue.push (std: :function<void() >(£)); «-p 

ET 

这 个 实现 使 用 一 个 向 量 来 保存 工作 线程 @， 使 用 一 个 第 6 章 中 线程 安全 的 队列 @ 
来 管理 待 处 理 的 任务 。 在 这 个 实现 中 ， 用 户 不 能 等 待 任务 ， 也 不 能 返回 任何 值 。 所 以 你 
可 以 使 用 std: :function<void() > 来 封装 你 的 任务 。 函 数 submit () 将 任何 函数 或 
者 能 够 调用 的 对 象 包装 成 为 std: :function«void 0 > 实例 ， 然 后 放 到 队列 中 四 。 

工作 线程 是 在 构造 器 中 创建 的 ,用 户 使 用 scd: :thread: :hardware concurrency () 
来 告诉 用 户 硬件 支持 的 并 发 线程 数量 @, 然后 创建 同样 数量 的 线程 来 执行 worker_thread () 
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成 员 函 数 @ 。 

创建 一 个 线程 可 能 会 失败 ， 然 后 抛 出 一 个 异常 ， 所 以 你 需要 保证 你 已 经 创建 的 任何 
线程 都 能 够 非常 合适 的 停止 并 且 清 理 掉 ,这 个 功能 是 通过 一 个 try-catch 块 来 完成 的 。 
当 异 常 出 现 的 时 候 设置 done 标志 四 ， 在 另外 一 边 第 8 章 的 join_threads@ 的 一 个 
实例 被 用 来 等 待 所 有 工作 线程 的 结束 。 这 也 可 以 在 析 构 函数 中 完成 ， 只 要 设置 done 标 
EO, join threads 实例 会 保证 在 线程 池 被 销毁 前 所 有 线程 已 经 完成 。 注 意 成 员 变量 
声明 的 顺序 是 重要 的 ，done 标志 跟 work_queue 必须 声明 在 threads 向 量 前 面 ， 
threads 向 量 必须 声明 在 joiner 前 面 。 这 个 顺序 保证 所 有 成 员 会 被 正确 的 销毁 掉 。 
例如 ， 在 所 有 线程 停止 之 前 工作 线程 队列 不 能 被 安全 的 销毁 。 

iK worker thread 的 实现 非常 简单 。 它 包含 一 个 循环 等 待 直到 done 标志 碑 设 
置 @， 不 停 的 从 队列 中 取出 任务 日 ， 然 后 执行 它们 @。 如 果 队 列 中 没有 任务 ， 它 会 调用 
std::this thread: :yield() 暂 停 一 小 段 时 间 @， 在 下 次 执行 前 给 其 他 线程 一 个 机 
会 往 队列 中 添加 任务 。 

在 许多 情况 下 ,这 样 一 个 简单 的 线程 池 是 足够 用 了 ,特别 是 如 果 所 有 任务 是 完全 独 
立 的 并 且 不 返回 任何 值 或 者 执行 一 些 阻塞 的 操作 。 但 是 存在 许多 简单 线程 池 无 法 满足 用 
户 需求 的 情况 ， 在 这 些 情 况 下 可 能 会 引起 一 些 问题 ， 比 如 死 锁 。 在 简单 情况 下 ， 用 户 像 
第 8 章 的 例子 一 样 使 用 std: :async 可 能 会 得 到 更 好 的 解决 办 法 。 在 本 章 中 ， 我 们 会 
使 用 一 些 更 加 复杂 的 线程 池 实 现 来 提供 额外 的 特征 来 解决 用 户 需要 的 或 者 减少 潜在 的 
问题 。 首 先是 等 待 一 个 我 们 提交 的 任务 。 


9.1.2 ”等 待 提交 给 线程 池 的 任务 


第 8 章 的 例子 都 是 显 式 的 创建 线程 。 在 划分 任务 给 线程 后 ， 主 线程 总 是 等 待 创建 的 线 
程 结束 来 保证 在 返回 给 调用 者 之 前 所 有 任务 都 已 经 完成 了 。 使 用 线程 池 之 后 ， 你 需要 等 得 
提交 到 线程 池 的 任务 结束 ， 而 不 是 等 待 工作 线程 。 这 一 点 跟 第 8 章 中 基于 std: :async 的 
例子 有 点 相似 。 但 是 在 清单 9.1 实现 的 线程 池 中 , 你 必须 人 为 的 使 用 第 4 章 中 的 条 件 变量 等 
来 实现 这 一 点 。 这 会 增加 代码 的 复杂 性 。 如 果 能 够 直接 等 待 任务 结束 会 更 好 。 

通过 将 复杂 度 移 到 线程 池 中 ， 可 以 直接 等 待 任务 的 结束 。 可 以 让 submit () 函数 返 
回 一 个 任务 句柄 ， 利 用 这 个 句柄 可 以 等 待 任务 结束 。 这 个 任务 句柄 包装 了 条 件 变量 或 者 
其 他 来 简化 使 用 线程 池 的 代码 。 

作为 一 个 特别 的 例子 ， 当 主线 程 需要 任务 计算 的 结果 的 时 候 ， 主 线程 不 得 不 等 待 任 
务 的 结束 。 这 样 的 例子 一 直 在 本 书 中 出 现 ， 比 如 第 2 章 的 Parallel accumulate K 
数 。 在 这 个 例子 中 ， 你 可 以 通过 使 用 std: : future 来 等 待 线程 的 结束 ， 然 后 组 合 每 个 
线程 的 结果 。 清 单 9.2 展示 了 人 允许 你 等 待 任务 结束 和 传递 返回 值 到 等 待 的 线程 需要 对 简 
单线 程 池 做 的 修改 。 因 为 std: :packaged_task<> 的 实例 只 是 可 移动 的 , 而 不 是 可 复 
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制 的 , 不 再 能 够 用 std: : function<> 来 作为 队列 中 的 元 素 , 因为 std: :function<> 
要 求 存 储 的 函数 对 象 是 可 以 拷贝 和 构造 的 。 因 此 ， 必 须 使 用 一 个 定制 的 函数 包装 来 处 理 
只 能 移动 的 类 型 。 这 是 一 个 简单 的 带 有 一 个 调用 操作 符 的 类 。 因 为 只 需要 处 理 不 带 有 参 


f 
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数 并 且 返 回 void 的 函数 ， 所 以 用 了 很 直观 的 虚 调 用 来 实现 。 


清单 9.2 ”有 等 待 任务 的 线程 池 


class function wrapper 


{ 


struct impl_base { 
virtual void call() 


=0; 
virtual -impl base() 


{} 
n 

Std::unique ptr«impl base» impl; 
template<typename F> 

struct impl_type: impl_base 


{ 


Bor 
impl type(F&& f ): f(std::move(f_)) {} 
void call Ots £027 


p 


public: 


P» 


template<typename F> 
function wrapper(F&& f): 

impl (new impl type«F»(std::move(£f))) 
Ü 


void operator()() ( impl->call(); ) 
function wrapper() = default; 


function wrapper(function wrapper&& other): 
impl (std: :move (other.impl)) 
{} 


function wrapper& operator- (function wrapper&& other) 
{ 

impl=std: :move (other.impl); 

return,*this; 


} 


function wrapper(const function wrapper&)-delete; 
function wrapper(function wrapper&)-delete; 
function wrapper& operators (const function wrapper&)-delete; 


class thread pool 


{ 


thread_safe_queue<function_wrapper> work_queue; 


void worker thread() 


( 使 用 函数 包装 器 而 非 
while(!done) std::function 


{ 


function_wrapper task; 
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if (work_queue.try_pop (task) ) 


{ 


task (); 


} 


else 


{ 


std::this thread: :yield() ; 


} 
} 


public: 
template<typename FunctionType> 
std::future<typename std::result_of<FunctionType() >: :type> +@ 


submit (FunctionType f) 


{ 
typedef typename std::result of«FunctionType()»::type 
result_type; 


std: :packaged_task<result_type()> task (std: :move(f)); +O 
std::future<result_type> res(task.get future()); <0 
work_queue.push(std: :move (task) ) ; 

return res; 


} 


// rest as before 


首先 , 修改 后 的 submit () 函数 @ 返回 一 个 std: :future<> 对 象 来 保存 任务 的 返回 
值 和 允许 调用 者 等 待 任务 结束 。 这 要 求 你 知道 任务 函数 £ 的 返回 值 ， 其 值 为 
std::result of<>， 这 个 值 来 自 于 std: :result_of<FunctionType()>::type, 
这 个 值 是 不 带 参数 地 调用 FunctionType (m £) 的 返回 值 。 通 过 使 用 typedef 来 将 同 
REM) std: :result_of<> 表 达 式 简写 为 result type@。 

然后 将 函数 £ 包装 在 一 个 std: :packaged_task<result type()> 中 人 @@, 因为 f 
是 一 个 返回 值 类 型 为 result type 并 且 没 有 参数 的 函数 或 者 可 以 调用 的 对 象 ， 正 如 我 们 
推导 的 一 样 。 你 可 以 在 将 任务 加 入 到 等 待 队列 之 前 © 通过 std: :packaged task<> 得 到 
一 个 future 对 象 @， 然 后 返回 这 个 future HR @。 注 意 你 必须 使 用 std: :move () 来 将 任 
务 加 入 到 等 待 队列 中 ， 因 为 std: : packaged_task<> 不 是 可 以 拷贝 的 。 为 了 处 理 这 个 特 
性 ， 等 待 队列 中 现在 存储 的 是 function wrapper 对 象 ， 而 不 是 std::function 
<void()> 队 列 。 

这 个 线程 池 的 实现 允许 你 等 待 你 的 任务 结束 以 及 得 到 任务 的 返回 值 。 清 单 9.3 展示 
了 使 用 这 个 线程 池 来 实现 Parallel_accumulate 函数 。 


清单 9.3 ”使 用 可 等 待 任务 线程 池 的 parallel accumulate 


template<typename Iterator,typename T» 
T parallel accumulate(Iterator first,Iterator last,T init) 


{ 


unsigned long const length=std::distance (first, last); 
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if(!length) 
return init; 


unsigned long const block size-25; 
unsigned long const num blocks-(length«block size-1)/block size; <0 


Std::vector«std::future«T» > futures (num_blocks-1); 
thread_pool pool; 


Iterator block _start=first; 


for (unsigned long i=0;i<(num_blocks-1) ;++i) 


Iterator block_end=block_start; 

Std::advance(block end,block size); 

futures [i] =pool.submit (accumulate block«Iterator,T»()); a9 
block start-block end; 


} 

T last result-accumulate block«Iterator,T»() (block start,last); 
T result=init; 

for (unsigned long i=0;i<(num_blocks-1) ;++i) 


result+=futures [i] .get(); 


} 
result += last_result; 
return result; 


当 你 将 清单 9.3 的 代码 跟 清单 8.4 的 代码 比较 的 时 候 ， 存 在 几 个 地 方 需要 注意 的 。 
首先 ， 你 是 跟 数 据 块 的 数量 (num_blocks@) 打交道 ， 而 不 是 多 少 个 线程 。 为 了 能 够 
充分 使 用 线程 池 的 扩展 性 ， 需 要 将 任务 划分 为 最 小 的 值得 并 行 的 块 。 当 线程 池 中 只 有 少 
量 线程 时 ， 每 个 线程 需要 处 理 许多 数据 块 。 但 是 当 线程 数量 随 着 硬件 的 发 展 而 增长 时 ， 
被 并 发 处 理 的 数据 块 也 增长 。 

你 需要 谨慎 选择 “最 小 的 值得 并 行 处 理 的 块 "。 每 个 提交 到 等 待 队 列 中 的 子 任务 需 
要 有 一 定 的 开销 。 这 些 开销 包括 提交 到 等 待 队列 的 开销 ， 由 工作 线程 去 执行 任务 的 额外 
开销 ,将 结果 通过 std: :future<> 返 回 给 调用 线程 的 开销 。 如 果 选 择 的 块 太 小 ， 在 线 
程 池 中 执行 的 速度 可 能 比 使 用 单线 程 的 速度 还 要 慢 。 

假定 块 的 大 小 是 合适 的 ， 你 不 需要 担心 打包 任务 ， 获 得 future 或 者 存储 
std: :thread 以 供 后 面 等 待 线程 结束 使 用 。 线 程 池 会 处 理 这 些 细节 。 所 有 你 需要 做 的 
只 是 调用 submit () 来 提交 你 的 任务 @。 

线程 池 也 处 理 异 常 的 安全 事宜 等 。 任何 由 任务 抛 出 的 异常 会 被 传递 到 submit () 返 
EIK future 中 。 如 果 函 数 带 着 异常 退出 ， 线 程 池 会 丢弃 掉 还 没有 完成 的 任务 然后 等 待 线 
程 池 中 的 线程 结果 。 

这 个 线程 池 在 针对 每 个 任务 都 是 独立 的 时 候 工作 得 非常 好 。 但 是 当 任务 之 间 有 依赖 
关系 的 时 候 ， 这 个 线程 池 就 不 能 很 好 地 工作 了 。 
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9.1.3 等待 其 他 任务 的 任务 


在 本 书 中 ,我 们 一 直 使 用 快速 排序 算法 作为 例子 。 快 速 排序 的 原理 非常 简单 ， 给 定 
一 个 哨兵 元 素 ， 数 据 被 划分 为 两 个 序列 ， 一 个 序列 的 元 素 都 在 哨兵 元 素 之 前 ， 另 外 一 个 
序列 是 在 哨兵 元 素 之 后 。 然 后 利用 递归 将 两 个 序列 排序 ， 将 两 个 子 序列 的 结果 连接 起 来 
得 到 排序 的 最 终结 果 。 在 并 行 化 这 个 算法 时 ， 你 需要 保证 这 些 递 归 调用 能 够 充分 利用 可 
用 的 并 行 性 。 

回顾 第 4 章 ， 当 我 首次 介绍 这 个 例子 的 时 候 ， 我 们 使 用 std::async 来 运行 其 中 
的 一 个 递归 调用 ,让 库 来 选择 是 使 用 一 个 新 的 线程 来 执行 它 还 是 当 有 关 的 get O 被 调用 
时 来 异步 执行 它 。 这 种 方式 能 够 很 好 地 工作 , 因为 每 个 任务 或 者 是 在 自己 的 线程 上 执行 ， 
或 者 是 当 需 要 的 时 候 会 被 调用 。 

在 第 8 章 当 我 们 重新 审视 快速 排序 的 实现 时 ， 你 看 到 一 个 不 同 的 结构 。 在 那里 我 们 
使 用 一 组 固定 数目 的 线程 。 在 这 种 情况 下 ， 我 们 使 用 一 个 栈 来 保存 需要 排序 的 序列 。 因 
为 每 个 线程 将 它 正在 排序 的 数据 进行 划分 ， 它 将 一 个 新 的 数据 块 放 到 栈 上 ， 对 另外 一 个 
数据 集 直接 进行 排序 。 在 这 个 做 法 中 ， 直 观 的 等 待 其 他 块 结束 可 能 会 死 锁 ， 因 为 你 在 使 
用 一 个 线程 来 等 待 。 很 容易 会 出 现 所 有 线程 都 是 在 等 待 某 个 数据 块 被 排序 ,没有 一 个 线 
程 在 执行 实际 的 排序 过 程 。 我 们 通过 让 线程 在 等 待 某 个 未 排序 的 数据 块 的 时 候 从 栈 上 拿 
出 一 个 待 处 理 的 数据 来 排序 来 解决 这 个 问题 。 

如 果 你 将 第 4 章 的 例子 中 的 std: :async 替换 成 为 本 章 你 已 经 见 到 的 简单 线程 池 
的 时 候 ， 你 会 磁 到 同样 的 问题 。 线 程 池 中 只 有 有 限 数目 的 线程 ， 他 们 可 能 都 停 在 等 待 某 
个 还 没有 被 执行 的 任务 。 所 以 你 需要 一 个 与 你 在 第 8 章 见 到 的 类 似 的 解决 方案 ， 当 你 在 
等 待 你 的 数据 块 结束 的 时 候 去 处 理 未 完成 的 数据 块 。 当 你 在 使 用 线程 池 来 管理 任务 列表 
以 及 它们 关联 的 线程 的 时 候 ， 你 不 必 去 通过 访问 任务 列表 来 完成 这 个 。 你 需要 做 的 是 修 
改线 程 池 的 结构 来 自动 完成 这 个 。 

最 简单 的 访问 来 完成 这 个 功能 的 是 在 线程 池 中 增加 一 个 新 的 函数 来 执行 队列 中 的 
任务 以 及 自己 管理 循环 。 高 级 线程 池 的 实现 可 能 会 在 等 待 函数 添加 逻辑 来 处 理 这 种 情 
形 ， 有 可 能 是 通过 给 每 个 在 等 待 的 任务 赋予 优先 级 来 解决 。 代 码 清单 9.4 展示 了 一 个 新 
的 函数 run_pending_task() ， 代 码 清单 9.5 展示 了 使 用 这 个 函数 来 实现 快速 排序 。 


清单 9.4 run pending task() 的 实现 


void thread pool::run pending task() 


function wrapper task; 
if(work queue.try pop (task) ) 


{ 


task (); 
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) 


else 


{ 
} 


gtd: this: thread: :yield(); 


run pending stask() 的 这 个 实现 是 从 worker thread ( 函数 的 主 循环 中 提 
升 出 来 的 ， 它 现在 被 修改 为 提取 的 run pending task() 。 它 试图 从 队列 中 取出 一 个 
任务 ， 如 果 成 功 则 执行 取出 的 任务 ， 否 则 它 放 弃 CPU， 人 允许 操作 系统 重新 调度 线程 。 清 
单 9.5 的 快速 排序 的 实现 要 比 代码 清单 8.1 的 对 应 实现 要 简单 很 多 ， 因 为 所 有 管理 线程 
的 逻辑 被 移动 到 了 线程 内 部 中 。 


清单 9.5 ”基于 线程 池 的 快速 排序 的 实现 


template<typename T» 


struct sorter «9 
{ 
thread_pool pool; ES 2) 


Std::list«T» do sort(std::list«T»& chunk data) 


{ 


if (chunk_data.empty () ) 


{ 
} 


std::list<T> result; 
result.splice (result .begin(),chunk_data, chunk_data.begin() ) ; 
T const& partition val-*result.begin(); 


return chunk data; 


typename std::list«T»::iterator divide point- 
Std::partition(chunk data.begin(),chunk data.end(), 
[&] (T const& val) {return val«partition val;]); 


Std::list«T» new lower chunk; 

new lower chunk.splice(new lower chunk.end(), 
chunk data,chunk data.begin(), 
divide point); 


std::future<std::list<T> > new lower- +9 
pool.submit (std: :bind(&sorter: :do_sort,this, 
std: :move (new_lower_chunk) ) ) ; 


Std::list«T» new higher(do sort (chunk_data) ) ; 


result.splice(result.end(),new higher); 

while(!new lower.wait for(std::chrono::seconds(0)) == 
Std::future status::timeout) 

( 


) 


result.splice(result.begin(),new lower.get()); 


pool.run pending task(); 0 
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return result; 
} 
ya 


template<typename T> 
std::list<T> parallel_quick_sort (std: :list<T> input) 


{ 
if (input.empty()) 


{ 


return input; 


} 


sorter<T> S; 


return s.do_sort (input) ; 


} 

正如 清单 8.1 一 样 ， 你 将 实际 的 排序 工作 放 到 了 sorter 类 模板 中 的 成 员 函 数 
do sort () 中 @， 虽然 在 这 个 例子 中 这 个 类 知识 简单 的 包装 了 thread_poo1 的 实例 e. 

你 的 线程 和 任务 管理 要 做 的 是 向 线程 池 提 交 一 个 任务 © 和 执行 正在 等 待 的 任务 @，。 
这 个 实现 比 清单 8.1 简单 很 多 。 在 清单 8.1 中 ， 你 不 得 不 显 式 的 管理 线程 和 栈 中 待 排序 
的 数据 块 。 当 向 线程 池 提 交 任 务 时 ,你 使 用 std: :bind 将 this 指针 绑 定 给 do_sort () 
和 提供 要 排序 的 数据 。 在 这 个 例子 中 ， 你 使 用 std: :move 作用 在 new 1ower chunk 
作为 参数 传 进 去 ， 来 保证 数据 是 被 移动 而 不 是 新 的 拷贝 。 

虽然 现在 的 线程 池 解决 了 任务 等 待 其 他 任务 中 的 关键 死 锁 问题 ， 这 个 线程 池 仍然 远 
远 不 是 理想 的 。 对 于 使 用 者 来 说 ， 每 个 submit 的 调用 和 每 个 run pending task ff 
访问 同一 个 队列 。 在 第 8 章 你 已 经 见 过 一 个 集合 的 数据 被 多 个 线程 并 发 的 访问 会 大 大 的 
降低 性 能 ， 所 以 你 需要 别 的 方法 来 解决 这 个 问题 。 


9.1.4 避免 工作 队列 上 的 竞争 


每 次 线程 调用 submit () 时 ， 它 向 单个 共享 工作 队列 添加 一 个 新 的 元 素 。 类 似 的 情 
形 为 ， 工 作 线 程 不 停 的 从 队列 中 取出 元 素来 执行 。 这 意味 着 随 着 处 理 器 数目 的 增加 ， 工 
作 队 列 的 竞争 会 越 来 越 多 ， 这 会 极 大 地 降低 性 能 。 即 使 你 使 用 无 锁 队 列 ， 虽 然 没 有 显 式 
的 等 待 ， 但 是 乒乓 缓存 会 非常 耗 时 。 

避免 乒乓 缓存 的 一 个 方法 是 在 每 个 线程 都 使 用 一 个 单独 的 工作 队列 。 每 个 线程 将 新 
的 任务 添加 到 它 自己 的 队列 中 , 只 有 当 自己 队列 为 空 的 时 候 才 从 全 局 的 工作 队列 中 取 任 
务 。 清 单 9.6 展示 了 一 个 使 用 thread local 变量 来 保证 每 个 线程 有 一 个 自己 的 工作 
队列 再 加 上 一 个 全 局 的 工作 队列 。 


清单 9.6 ”使 用 本 地 线程 工作 队列 的 线程 池 


class thread pool 


thread safe queue«function wrapper» pool work queue; 
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typedef std::queue«function wrapper» local queue type; 0 
static thread_local std::unique_ptr<local_queue_type> 
local_work_queue; “e 
void worker thread() 
{ 
local_work_queue.reset (new local_queue_type) ; -© 


while(!done) 


( 
) 


run pending task(); 


) 


public: 
template<typename FunctionType> 
std::future<typename std: :result_of<FunctionType() >::type> 
submit (FunctionType f) 
{ 


typedef typename std::result_of<FunctionType()>::type result type; 


std: :packaged_task<result_type()> task(f); 
std::future<result_type> res(task.get future()); 
if(local work queue) 0 
{ 


) 


else 


( 
) 


return res; 


local work queue-»push(std::move (task)); 


pool work queue.push(std::move(task)); 0 


) 
void run pending task () 
{ 
function_wrapper task; 
if(local work queue && !local_work_queue->empty () ) +@ 
{ 
task=std: :move (local_work_queue->front ()) ; 
local work queue-»pop(); 
task(); 
) 
else if(pool work queue.try pop(task)) +@ 
{ 


} 
else 


{ 
} 


task () ; 


std::this_thread::yield(); 


} 


// rest .as before 


hi 
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我 们 使 用 一 个 std: :unique_ptr<> 来 保存 线程 私有 的 工作 队列 因为 我 们 不 想 让 
非 线程 池 中 的 线程 也 持 有 一 个 @ ;这 个 是 在 worker_thread() 中 主 循环 之 前 进行 初始 
Me 6, std: :unique ptr<> 的 析 构 函数 保证 了 当 线程 退出 的 时 候 其 工作 队列 会 被 适当 
地 销毁 。 

submit () 函数 会 检查 当前 线程 是 否 有 一 个 工作 队列 @。 如 果 有 ， 则 说 明 当 前 线程 
是 一 个 线程 池 中 的 线程 ， 这 是 可 以 将 任务 添加 到 私有 的 工作 队列 中 ， 和 否则 像 之 前 一 样 将 
任务 加 入 到 全 局 工作 队列 中 ©, 

E run pending task() 中 有 一 个 类 似 的 检查 ©, 不 过 这 次 是 检查 私有 队列 中 是 
否 有 任务 。 如 果 有 ， 可 以 从 队列 中 取出 一 个 来 处 理 。 注 意 到 私有 队列 可 以 是 普通 的 
std: :queue<>@ 因为 私有 队列 只 被 一 个 线程 访问 。 如 果 私 有 队列 中 没有 任务 ， 则 像 
之 前 一 样 从 全 局 队列 取 任务 @。 

这 能 够 很 好 地 降低 对 全 局 队列 的 竞争 , 但 是 当 任务 的 分 布 是 不 平衡 的 ， 可 能 导致 一 
些 线程 的 私有 队列 中 有 大 量 的 任务 而 另外 一 些 线程 则 没有 任务 处 理 。 比 如 ,在 快速 排序 
中 ， 只 有 最 顶层 的 任务 会 被 添加 到 全 局 工作 队列 中 ， 因 为 其 余 的 数据 会 放 在 某 个 工作 线 
程 的 私有 队列 中 。 这 跟 使 用 线程 池 的 初衷 是 相反 的 。 

幸运 的 是 ， 有 一 些 办 法 来 解决 这 个 问题 。 只 要 允许 线程 在 自己 私有 队列 以 及 全 局 队 
列 中 都 没有 任务 时 从 其 他 线程 的 队列 中 窃取 工作 。 


9.1.5 LFS 


为 了 允许 一 个 空闲 的 线程 执行 其 他 线程 上 的 任务 , 每 个 工作 线程 的 私有 队列 必须 在 
run pending_task () 中 窃取 任务 的 时 候 可 以 被 访问 到 。 这 要 求 每 个 工作 线程 将 自己 
的 私有 任务 队列 向 线程 池 注册 或 者 每 个 线程 都 会 被 线程 池 分 配 一 个 工作 队列 。 此 外 ,你 
必须 保证 工作 队列 中 的 数据 被 适当 的 同步 和 保护 ， 这 样 你 的 不 变量 是 被 保护 的 。 

编写 一 个 允许 拥有 队列 的 线程 在 一 端 push 和 pop 同时 其 他 线程 在 另外 一 端 进行 任 
务 窃取 的 无 锁 队 列 是 有 可 能 的 。 但 是 实现 这 样 一 个 队列 比较 复杂 ， 超 出 了 本 书 的 范围 。 
为 了 验证 这 个 想法 ,我 们 使 用 互 斥 锁 来 保护 队列 的 数据 。 我 们 希望 任务 窃取 是 一 个 不 经 
常 发 生 的 时 间 ， 这 样 互 斥 元 的 竞争 就 不 是 那么 激烈 这样 一 个 简单 的 队列 应 当 只 包括 一 
个 极 小 的 额外 开销 。 清 单 9.7 所 示 是 一 个 简单 的 基于 锁 的 实现 。 


清单 9.7 ”允许 任务 窃取 的 基于 锁 的 队列 


class work stealing queue 

{ 

private: 
typedef function wrapper data type; 
std::deque«data type» the queue; 
mutable std::mutex the mutex; 
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public: 
work stealing queue() 


{} 


work_stealing_queue(const work stealing queue& other) =delete; 
work stealing queue& operator= ( 
const work stealing queue& other)-delete; 


void push(data type data) -© 
{ 


std::lock_guard<std::mutex> lock (the mutex); 
the queue.push front (std: :move (data) ) ; 


) 


bool empty() const 


{ 


std: :lock_guard<std::mutex> lock(the mutex); 
return the queue.empty(); 


} 
bool try pop(data type& res) 0 


Std::lock guard«std::mutex» lock(the mutex); 
if (the_queue.empty () ) 


{ 
} 


res=std: :move (the queue.front()); 
the queue.pop front (); 
return true; 
} " 
bool try steal(data type& res) 0 


{ 


return false; 


Std::lock guard«std::mutex» lock(the_mutex) ; 
if (the_queue.empty () ) 


{ 
} 


res-std::move(the queue.back()); 
the queue.pop back(); 
return true; 


return false; 


i 

这 个 队列 是 一 个 对 std: :deque<function wraper>@ 的 封装 ,使 用 一 个 互 斥 锁 
来 保护 所 有 的 访问 , push 0 6 fil try pop 0 © 在 队列 头 部 操作 , 而 try_steal ()@ 
在 队列 尾部 操作 。 

这 实际 上 意味 着 这 个 队列 对 于 拥有 线程 来 说 是 一 个 后 进 先 出 的 栈 。 最近 被 放 到 队列 
中 的 任务 会 最 先 被 取出 来 执行 。 从 缓存 的 角度 来 说 这 可 以 提高 性 能 ， 因 为 对 比 之 前 被 放 
和 人 队列 中 的 任务 ， 被 取出 的 任务 的 数据 更 加 有 可 能 在 缓存 中 。 同 样 ， 这 个 队列 能 够 很 好 
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的 映射 像 快 速 排 序 之 类 的 算法 。 在 之 前 的 实现 中 ， 每 次 调用 do sort () 将 一 个 数据 放 
到 栈 中 然后 等 待 它 完成 。 通 过 处 理 最 近 放 入 的 数据 ， 你 可 以 保证 当前 调用 完成 需要 的 数 
据 块 会 比 其 他 分 支 调用 需要 的 数据 块 先 处 理 好 , 这样 可 以 减少 活动 的 任务 数目 和 总 的 栈 
空间 使 用 量 。try_steal () 从 队列 的 另外 一 端 取 数 据 ， 这 样 可 以 最 小 化 竞争 。 你 同样 
可 以 使 用 第 6 章 和 第 7 章 中 的 技术 来 实现 并 发 调用 try pop () Al try_steal(), 

现在 你 已 经 有 一 个 很 好 的 允许 窃取 的 工作 队列 ， 怎 样 把 它 使 用 在 你 自己 的 线程 池 中 
We? 清单 9.8 是 一 个 可 能 的 实现 。 


清单 9.8 使 用 工作 窃取 的 线程 池 


class thread pool 


Ü 


typedef function wrapper task type; 


Std::atomic bool done; 

thread safe queue«task type» pool work queue; 
Std::vector«std::unique ptr«work stealing queue» > queues; 0 
std: :vector<std: :thread> threads; 

join_threads joiner; 


static thread_local work_stealing_queue* local_work_queue; +O 
static thread_local unsigned my_index; 


void worker_thread(unsigned my_index_) 

{ 
my_index=my_index_j; 
local_work_queue=queues [my index].get(); -© 
while (!done) 


{ 
} 


run pending task(); 


) 

bool pop task from local queue(task type& task) 
{ 

} 

bool pop task from pool queue(task type& task) 
{ 

} 


bool pop_task_from_other_thread_queue (task_type& task) 0 


{ 


return local_work_queue && local_work_queue->try_pop (task) ; 


return pool_work_queue.try_pop (task) ; 


for (unsigned i=0;i<queues.size() ;++i) 


{ 
unsigned const index- (my index«i«1)$queues.size(); 0 
if (queues [index] ->try_steal (task) ) 


{ 
} 


return true; 
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} 


return false; 


} 


public: 
thread pool(): 
done (false), joiner (threads) 
{ 


unsigned const thread count-std::thread::hardware concurrency(); 


try 


{ 


for (unsigned i=0;i<thread_count;++i) 


{ 


queues.push back(std::unique ptr«work stealing queue»( +@ 
new work stealing queue) ) ; 
threads .push_back ( 
Std::thread(&thread pool::worker thread,this,i)); 


} 
} 
et dot n U ANS 


done=true; 
throw; 


} 


~thread_pool () 


{ 
} 


template<typename FunctionType> 
std: :future<typename std::result_of<FunctionType()>::type> submit ( 
FunctionType f) 


done=true; 


{ 


typedef typename std::result_of<FunctionType()>::type result_type; 


std: :packaged_task<result_type()> task(f) ; 
Std::future«result type» res(task.get future()); 
if(local work queue) 


{ 
} 


else 


{ 
} 


return res; 


local work queue-»push(std::move (task) ) ; 


pool work queue.push(std::move(task)); 


) 


void run pending task() 


{ 
task_type task; ded 
if(pop task from local queue(task) || 
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pop task from pool queue (task) B 0 
pop_task_from_other_thread_queue (task) ) -© 


task(); 


} 


else 


std::this thread::yield(); 
} 
15; 

这 个 实现 跟 清 单 9.6 中 的 实现 非常 类 似 。 第 一 个 区 别 在 于 每 个 线程 都 拥有 一 个 
work stealing queue, 而 不 是 普通 的 std: :queue<>@。 当 创 建 每 个 线程 的 时 候 ， 
不 是 每 个 线程 都 创建 一 个 自己 的 工作 队列 ， 而 是 线程 池 的 构造 器 为 其 分 配 一 个 @, 这 个 
队列 是 存储 在 一 个 工作 队列 的 表 中 @。 队 列 的 下 标 被 传递 给 线程 函数 ,然后 被 用 来 获得 
指向 队列 的 指针 四。 这 意味 着 当 试图 为 空闲 线程 窃取 任务 时 线程 池 可 以 访问 该 队列 。 
run pending task () 现在 会 试图 从 自己 队列 中 取出 任务 @， 从 池 队 列 中 取出 任务 @， 
或 是 从 其 他 线程 的 队列 中 取出 工作 @。 

pop task from other thread queue()O0 遍历 线程 池 中 所 有 线程 的 队列 , 试 
图 一 次 从 每 个 队列 中 窃取 一 个 任务 。 为 了 避免 每 个 线程 都 从 第 一 个 线程 的 队列 窃取 ， 每 
个 线程 从 列表 中 的 下 一 个 线程 窃取 ， 通 过 用 自己 队列 的 下 标 来 偏 移 队列 下 标 @。 

现在 你 有 一 个 线程 池 可 以 应 用 在 许多 地 方 。 当 然 ， 仍 然 有 许多 方法 针对 一 些 特别 的 
用 法 去 提高 它 。 这 个 是 留 给 读者 的 练习 。 一 个 没有 被 提 及 的 方面 是 当 线程 被 阻塞 了 ， 在 
等 待 如 输入 输出 或 者 互 斥 锁 ， 动 态 地 修改 线程 池 的 大 小 来 保证 有 最 优 的 CPU 使 用 率 。 

下 一 个 “高 级 ”的 线程 管理 技术 是 中 断 线程 。 


中 断 线 程 


在 许多 场景 中 , 向 一 个 长 时 间 运 行 的 线程 发 出 一 个 信号 告诉 线程 是 停止 执行 的 时 候 

是 一 个 很 渴望 的 行为 。 这 有 可 能 是 因为 线程 是 一 个 线程 池 的 工作 线程 而 线程 池 正在 被 销 

席 ， 或 者 是 因为 线程 正在 执行 的 工作 被 用 户 显 式 地 取消 了 ， 或 者 是 因为 其 他 一 些 原 因 。 

不 管 是 何 种 原因 ， 基 本 思想 是 一 样 的 ， 你 需要 从 一 个 线程 发 送 一 个 信号 告诉 另外 一 个 线 

程 应 该 停止 运行 而 不 是 一 直 执行 到 线程 自然 结束 ,你 同样 需要 让 线程 适当 的 结束 而 不 是 

简单 的 退出 而 造成 线程 池 不 一 致 的 状态 。 | 
你 当然 可 以 为 每 种 情况 都 设计 一 种 单独 的 机 制 ， 但 是 这 种 做 法 没有 通用 性 ， 引 入 许 | 

多 重复 工作 。 一 种 共有 的 机 制 不 但 可 以 让 为 后 面 的 场景 号 代码 变 得 容易 ， 而 且 允 许 你 写 

出 能 够 被 中 断 , 不 用 担心 在 什么 地 方 被 使 用 的 代码 。 C++11 标准 病 没有 提供 这 样 的 机 制 ， 

但 是 建立 这 样 的 机 制 是 相对 直观 的 。 让 我 们 先 看 看 怎样 可 以 完成 这 个 机 制 ， 从 启动 和 中 


274 


9.2.1 


第 9 章 ”高 级 线程 管理 


断 一 个 线程 的 接口 的 角度 开始 。 


启动 和 中 断 另 一 个 线程 


首先 让 我 们 从 可 中 断 线程 的 接口 开始 。 一 个 可 中 断 线 程 的 接口 需要 有 哪些 呢 ? 在 最 
基本 的 层次 上 ,所 有 你 需要 的 是 跟 std: : thread 一 样 的 接口 ,外 加 一 个 interrupt O 
函数 。 
class interruptible thread 
public: 

template<typename FunctionType» 

interruptible thread(FunctionType f); 

void join(); 

void detach(); 


bool joinable() const; 
void interrupt () ; 


在 内 部 , 你 可 以 使 用 std: : thread 来 管理 线程 本 身 , 然后 使 用 一 些 定制 的 数据 结 
构 来 处 理 中 断 。 从 线程 本 身 的 角度 来 看 中 断 是 什么 呢 ? 在 最 基本 的 层面 上 你 也 许 会 说 
“我 可 以 在 这 里 被 中 断 ”， 你 想 要 一 个 中 断 点 。 为 了 让 这 个 能 够 不 用 传递 额外 的 参数 就 能 
使 用 ,需要 一 个 简单 的 不 带 任 何 参数 的 函数 ，interruption point () 。 这 意味 着 中 
断 相关 的 数据 结构 需要 使 用 一 个 thread_local 的 变量 来 访问 ， 这 个 私有 变量 是 在 线 
程 启动 的 时 候 设置 好 的 。 这样 当 一 个 线程 调用 你 的 interruption point () 函数 的 时 
候 ， 它 会 检查 当前 运行 的 线程 的 数据 结构 。 我 们 随后 会 给 出 interruption point () 
的 实现 。 

这 个 thread local 标志 是 你 不 能 简单 的 使 用 std: :thread 来 管理 线程 的 主要 
原因 ， 它 需要 使 用 特殊 的 分 配方 法 ， 使 得 interruptible thread 实例 可 以 访问 ， 
并 且 新 启动 的 线程 也 能 够 访问 。 你 可 以 通过 在 传递 给 std: : thread 实际 启动 一 个 线程 
的 之 前 包装 一 下 ， 如 清单 9.9 所 示 。 


清单 9.9 interruptible thread 的 基本 实现 


class interrupt flag 


public: 

void set(); 

bool is set().const; 
r? 


thread local interrupt flag this thread interrupt flag; +@ 


class interruptible thread 


{ 


std::thread internal_thread; 
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interrupt flag* flag; 

public: 
template<typename FunctionType> 
interruptible thread(FunctionType f) 


std: :promise<interrupt_flag*> p; 
internal thread-std::thread([f,&pl( 
p.set value(&this thread interrupt flag); 
£(); 
beer 
flag-p.get future().get(); -© 


void interrupt () 


{ 


if (flag) 
{ 


flag-»set(); <0 

,| } 
t 

用 户 给 定 的 函数 E 被 包装 在 一 个 lambda 函数 中 @。 在 此 函数 中 ,保存 了 一 份 £ 的 
拷贝 以 及 一 个 局 部 promise 的 引用 P@ 。lambda 函数 在 调用 用 户 提供 的 函数 之 前 @ 为 新 
的 线程 将 promise WEE this thread interrupt flag (这 个 变量 被 声明 为 
thread local@) 的 地 址 。 被 调用 的 线程 然后 会 等 待 跟 promise 相关 联 的 future 变 得 
可 用 ,然后 存储 在 flag 成 员 变量 中 上 日。 注意 到 即使 lambda 函数 是 运行 在 新 线程 上 面 ， 
并 且 持 有 一 个 对 局 部 变量 p 的 应 用 , 这 是 没有 问题 的 。 因 为 interruptible thread 
的 构造 函数 会 一 直 等 待 直 到 p 不 再 被 新 的 线程 引用 。 注意 这 个 实现 不 负责 处 理 等 待 线程 
结束 或 者 分 离线 程 。 你 需要 保证 当 线程 存在 的 时 候 或 者 被 分 离 了 ，f1ag 标志 被 清理 掉 
来 避免 危险 的 指针 。 

interrupt () 函数 是 一 个 相对 直观 的 实现 ， 如 果 你 有 一 个 合法 的 指针 指向 一 个 中 
断 标志 , 你 有 一 个 线程 可 以 中 断 , 所 以 只 要 设置 flag 就 可 以 ©, 线程 中 断 标 志 设 置 后 ， 
有 被 中 断 的 线程 来 决定 怎么 处 理 这 个 中 断 。 


9.2.2 ”检测 一 个 线程 是 否 被 中 断 


现在 你 可 以 设置 中 断 标志 了 , 但 是 如 果 线 程 不 去 检查 它 自 身 是 否 被 中 断 的 话 不 会 给 
你 带 来 任何 好 处 。 在 最 简单 的 情况 下 , 你 可 以 使 用 interruption point O 函数 来 检 
查 线程 自身 是 否 被 中 断 ， 你 可 以 当 线程 可 以 被 安全 的 中 断 的 时 候 调用 这 个 函数 ， 如 果 中 
断 标 志 被 设置 的 话 它 会 抛 出 一 个 thread interrupted JM, ; 


void interruption_point () 


{ 


if(this thread interrupt flag.is set()) 
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throw thread interrupted(); 
) 
) 


你 可 以 在 某 个 方便 的 点 上 调用 这 个 函数 。 


void foo() 


{ 


while (! done) 


{ 
interruption_point () ; 
process next item(); 
) 
) 
虽然 这 可 以 工作 , 但 是 它 不 完美 。 在 一 些 中 断 线程 最 好 的 地 方 是 它 被 阻塞 住 了 ， 正 
在 等 待 某 个 信和 号。 这 意味 着 线程 为 了 调用 interruption point () 没有 在 运行 ! 在 这 
里 你 需要 的 是 一 个 通过 使 用 中 断 的 方式 来 等 待 某 个 事情 。 


9.2.3 ”中 断 等 待 条 件 变量 


现在 你 可 以 通过 在 精心 选 定 的 位 置 上 显 式 调用 interruption point () 来 检测 
中 断 。 但 是 当 你 想 要 一 个 阻塞 等 待 的 时 间 ， 如 等 待 一 个 条 件 变量 被 通知 ， 这 不 能 给 你 多 
少 帮助 。 你 需要 一 个 新 的 函数 interruptible wait ()， 这 个 函数 你 可 以 为 你 想 要 等 
待 的 不 同 的 事情 重 载 。 你 可 以 知道 怎样 中 断 一 个 等 待 工作 。 我 已 经 提 到 一 个 你 可 能 想 要 
等 待 的 是 条 件 变 量 ， 所 以 让 我 们 从 条 件 变量 开始 。 为 了 能 够 中 断 一 个 条 件 变量 的 等 待 ， 
你 需要 怎样 做 呢 ? 最 简单 的 事情 是 当 你 设置 中 断 标志 的 时 候 通 知 条 件 变量 ， 然 后 在 等 待 的 
后 面 立 即 加 上 一 个 中 断 点 。 但 是 为 了 让 这 种 方式 可 以 工作 ， 你 不 得 不 通知 所 有 等 待 该 条 件 
变量 的 线程 来 保证 你 感 兴趣 的 线程 被 唤醒 。 等 待 者 们 需要 处 理 假 的 唤醒 ， 使 得 其 他 线程 能 
够 将 这 个 事件 当成 一 个 假 的 唤醒 。 interrupt_flag 结构 需要 能 够 存储 一 个 指向 条 件 变 量 
的 指针 这 样 它 可 以 在 有 调用 set O 的 时 候 被 通知 。interruptible_wait () 的 一 个 关 
于 条 件 变量 的 实现 如 下 面 清单 9.10 中 的 代码 所 示 。 


清单 9.10 因 std::condition variable 而 遭 到 破坏 的 interruptible wait 函数 实现 


void interruptible wait(std::condition variable& cv, 
std: :unique lock«std::mutex»& lk) 


{ 


interruption_point (); 

this thread_interrupt_flag.set_condition_variable (cv) ; 0 
cv.wait (lk); 

this thread interrupt flag.clear condition variable(); -© 


interruption point(); 


假定 设置 和 清除 一 个 带 着 中 断 标 志 的 条 件 变量 的 函数 存在 ,这 个 代码 是 优质 而 且 简 
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单 的 。 它 先 检查 中 断 ， 然 后 为 当前 线程 关联 一 个 带 interrupt flag 的 条 件 变量 0, 

等 待 条 件 变量 @， 清 除 关 联 的 条 件 变量 日 ， 然 后 再 一 次 检查 中 断 。 如 果 线 程 是 在 等 竺 条 
件 变 量 的 时 候 被 中 断 的 ， 调 用 中 断 的 线程 会 广播 条 件 变量 将 你 唤醒 ， 所 以 你 可 以 检查 中 
断 。 不 幸 的 是 ， 这 份 代码 是 不 能 工作 的 。 它 存在 两 个 问题 。 第 一 个 问题 相对 比较 明显 。 

因为 std::condition variable::wait() 可 能 会 抛 出 异常 ， 所 以 你 可 能 没有 删除 
中 断 标 志和 条 件 变 量 的 关联 就 退出 了 。 这 可 以 通过 使 用 一 个 结构 的 析 构 函数 来 删除 关联 
性 来 修复 它 。 

第 二 个 问题 不 是 那么 明显 。 这 份 代码 中 存在 一 个 竞争 条 件 ， 如 果 线 程 是 在 调用 
interruption point () 后 面 被 中 断 ， 那么 条 件 变 量 是 否 跟 中 断 标志 关联 已 经 不 要 紧 
T, 因为 线程 不 是 在 等 待 所 以 不 能 被 条 件 变量 唤醒 。 你 需要 保证 线程 在 上 一 次 检查 中 断 
和 调用 wait O 之 间 不 能 被 通知 。 在 不 改变 std::condition variable 内 部 结构 的 
情况 下 ， 你 只 有 一 种 方法 来 做 这 个 ， 使 用 Lk 持 有 的 互 斥 锁 来 保持 这 块 区 域 。 这 要 求 将 
其 传递 给 调用 set condition variable, 不 幸 的 是 , 这 又 会 产生 一 个 问题 , 你 需要 
传递 一 个 生命 周期 未 知 的 互 斥 锁 给 另外 一 个 线程 ,那个 线程 在 不 知道 它 是 否 已 经 锁 住 互 
斥 锁 的 情况 下 试图 锁 住 。 这 有 潜在 的 死 锁 可 能 , 以 及 试图 锁 住 一 个 已 经 被 销毁 的 互 斥 锁 。 
如 果 不 能 可 靠 地 中 断 一 个 条 件 变 量 的 等 待 ， 限 制 会 非常 大 你 可 以 在 没有 特殊 的 
interruptible wait () 做 得 几乎 一 样 好 一 一 那么 你 还 有 其 他 什么 可 选 的 方法 呢 ? 
一 个 选项 是 在 等 待 中 放 和 人 一 个 等 待 的 最 大 时 间 ,给 wait for () 传递 一 个 很 小 的 时 间 
间隔 (如 1 毫秒 ) 而 不 是 使 用 wait () 。 这 给 线程 在 看 到 中 断 前 等 待 的 时 间 设 置 了 一 
个 上 限 。 如 果 你 这 样 做 ， 等 待 的 线程 会 看 到 由 定时 器 到 期 带 来 的 大 量 的 假 唤醒 ， 但 是 
它 不 能 轻易 地 带 来 帮助 。 清 单 9.11 是 这 样 的 一 个 实现 ,还 有 对 应 的 interrupt flag 
的 实现 。 


清单 9.11 在 为 std::condition_variable 的 interruptible wait 中 使 用 超时 


class interrupt flag 

{ 
std::atomic<bool> flag; 
std: :condition_variable* thread cond; 
std::mutex set_clear_mutex; 


public: 
interrupt_flag(): 
thread cond(0) 

0 


void set() 

{ 
flag.store(true,std::memory order relaxed); 
Std::lock guard«std::mutex» lk(set clear mutex); 
if(thread cond) 


{ 


278 


第 9 章 高 级 线程 管理 


thread cond-»notify al1(); 


bool is set() const 


{ 
} 


void set_condition_variable(std::condition_variable& cv) 


{ 


return flag.load(std::memory order relaxed); 


Std::lock guard«std::mutex» lk(set clear mutex); 
thread cond-&cv; 


) 


void clear condition variable() 


{ 


std: :lock_guard<std::mutex> lk(set clear mutex); 
thread cond-0; 


) 


Struct clear cv on destruct 


{ 


«clear cv on destruct() 


( 
) 


this thread interrupt flag.clear condition variable(); 


"m 


void interruptible wait(std::condition variable& cv, 


( 


Std::unique lock«std::mutex»& 1k) 


interruption point (); 

this thread interrupt flag.set condition variable (cv); 
interrupt flag::clear cv on destruct guard; 
interruption point(); 

cv.wait for(lk,std::chrono::milliseconds(1)); 
interruption point(); 


如 果 你 有 一 个 要 等 待 的 断言 ， 那 么 1 毫秒 的 超时 会 被 完全 隐藏 在 断言 的 循环 中 : 


template<typename Predicate> 
void interruptible wait(std::condition variable& cv, 


Std::unique lock«std::mutex»& 1k, 
Predicate pred) 


interruption point(); 

this thread interrupt flag.set condition variable(cv); 
interrupt flag::clear cv on destruct guard; 
while(!this thread interrupt flag.is set() && !pred()) 


{ 
} 


cev.wait_for(1lk,std::chrono: :milliseconds (1) ) ; 
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interruption point (); 


这 会 导致 等 待 的 条 件 被 检查 很 多 次 ， 但 是 非常 容易 地 用 于 代替 wait O 函数 调用 。 
带 定 时 器 的 变形 也 非常 容易 实现 ， 只 要 等 待 一 个 给 定 的 时 间 ， 如 1 毫秒 ， 或 者 其 他 短 时 
H. MÆ std::condition variable 等 待 已 久 可 以 处 理 的 ， 怎样 等 待 一 个 
std::condition variable any 变量 呢 ? 是 与 此 相同 ， 或 者 你 能 做 得 更 好 ? 


9.2.4 ”中 断 在 std::condition_variable_any 上 的 等 待 


std::condition variable any 变 量 跟 std: :condition_ variable 不 同 的 是 
它 可 以 跟 任何 锁 类 型 配合 工作 而 不 是 只 能 跟 std::unique lock<std: :mutex> 配 合 。 
结果 是 这 会 让 事情 变 得 简单 ， 你 可 以 更 好 地 处 理 std::condition variable any, [A 
为 它 可 以 跟 任何 锁 配 合 ， 你 可 以 建立 自己 的 锁 类 型 用 来 加 锁 / 解 锁 interrupt flag 的 内 
部 函数 set clear mutex 以 及 提供 给 等 待 调用 的 锁 ， 如 下 面 清单 9.12 Bras. 


清单 9.12 


class interrupt flag 


{ 


为 std::condition variable any 而 设 的 interruptible_wait 


std::atomic<bool> flag; 
std::condition_variable* thread cond; 
std::condition variable any* thread cond any; 
std::mutex set clear mutex; 


public: 
interrupt flag(): 
thread cond(0),thread cond any(0) 


ü 


void set() 


{ 


flag. store (true, std: :memory_order_relaxed) ; 
Std::lock guard«std::mutex» lk(set clear mutex); 
if (thread cond) 


{ 
} 
else if (thread_cond_any) 


{ 
} 


thread_cond->notify_all(); 


thread cond any-»notify all(); 


) 


template«typename Lockable> 

void wait(std::condition variable any& cv,Lockable& lk) 

| 
struct custom lock | 


{ 
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interrupt. flag* self; 
Lockable& lk; 


custom lock(interrupt flag* self , 
Std::condition variable any& cond, 
Lockable& lk ): 
self self) Akke] 


Self-»set clear mutex.lock(); 2 
Self-»thread cond any-&cond; +O 


} 


void unlock () «e 

{ 
lk.unlock(); 
Self-»set clear mutex.unlock(); 


) 


void lock() 


{ 
} 


~custom_lock () 


{ 


Std::lock(self-»set clear mutex,lk); 0 


self->thread_cond_any=0; -© 
self-»set clear mutex.unlock(); 


) 
}; 
custom lock cl(this,cv,lk); 
interruption point () ; 
cv.wait (cl); 
interruption point(); 
) 


// xest as before 


}; 


template<typename Lockable> 

void interruptible wait(std::condition variable any& cv, 
Lockable& 1k) 

{ 


) 


this thread interrupt flag.wait (cv,1k) ; 


你 的 自 定义 锁 类 型 在 其 构造 函数 @ 中 获得 内 部 Set clear mutex 锁 然 后 设置 指针 
thread cond any 指向 传递 给 构造 函数 @ HY std::condition variable any 变 
量 。Lockable 引用 保存 起 来 为 以 后 使 用 , 这 必须 已 经 被 锁 住 。 现在 你 可 以 不 用 担心 竞争 
来 检查 中 断 了 。 如 果 在 这 个 点 上 中 断 标 志 被 设置 ， 它 是 在 你 获得 set clear mutex 锁 
之 前 被 设置 的 。 当 条 件 变量 调用 你 的 unlock O 时 ， 你 释放 Lockable 对 象 以 及 内 部 的 
set clear mutex@ 。 此 时 允许 试图 中 断 你 的 线程 在 wait() 函数 内 部 去 获得 
set clear mutex 锁 和 检查 thread_cond any 指针 ,但 是 之 前 的 却 不 能 。 一 旦 wait () 
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函数 结束 等 待 ， 它 会 调用 你 的 lockO 函数 ， 这 个 函数 再 次 去 获得 内 部 的 
set clear mutex 和 Lockable 对 象 的 锁 @。 现 在 你 可 以 再 次 在 你 的 custom lock 
的 析 构 函数 清理 thread cond any 指针 之 前 再 次 调用 wait () 函数 去 检查 中 断 日 。 在 
custom lock 的 析 构 函数 中 你 也 会 释放 set clear mutex 9f, 


9.2.5 中 断 其 他 阻塞 调用 


到 现在 为 止 我 们 已 经 讨论 了 关于 条 件 变量 等 待 的 情况 ， 但 是 像 互 斥 锁 ，future 以 及 
其 他 类 似 的 阻塞 原 语 的 等 待 该 怎样 做 昵 ? 一 般 情况 下 ， 你 不 得 不 使 用 一 个 用 在 
std::condition 变量 的 定时 器 选项 ， 因 为 在 不 访问 互 斥 元 或 者 future 的 内 部 结构 的 
前 提 下 , 没有 办 法 来 中 断 一 个 短 时 间 的 等 待 。 但 是 使 用 定时 器 选项 你 知道 你 要 等 待 什么 ， 
所 以 你 可 以 在 interruptible wait () 函数 中 循环 检查 。 作 为 一 个 例子 , 下 面 代码 是 
针对 std: :future 的 interruptible wait() 重 载 版 本 。 


template<typename T> 
void interruptible wait (std::future<T>& uf) 


{ 


while(!this thread interrupt flag.is set()) 
{ 
if (uf.wait_for(1k,std::chrono: :milliseconds (1) == 
std: :future_status: :ready) 
break; 


} 


interruption_point () ; 


} 

这 会 一 直 等 到 要 么 中 断 标志 被 设置 ， 要 么 future 已 经 准备 好 了 ， 但 是 每 次 在 future 
上 执行 阻塞 等 待 lms。 这 意味 着 ， 假 定 使 用 高 精度 的 时 钟 ， 在 中 断 请 求 被 通知 之 前 平均 
每 次 大 概 需要 等 待 0.5ms。wait_for 函数 经 常会 等 待 一 整个 时 钟 滴答 ， 所 以 如 果 你 的 
时 钟 滴答 的 间隔 是 15ms， 你 会 每 次 至 少 等 待 15ms 而 不 是 Ims。 取 决 于 应 用 场景 ， 这 有 
可 能 会 变 得 无 可 坚守 。 你 总 是 可 以 降低 定时 器 到 期 的 时 间 间 隔 。 但 是 其 坏处 是 线程 被 唤 
醒 更 多 次 来 检查 中 断 标志 ， 这 会 增加 线程 切换 的 额外 开销 。 

到 现在 为 止 我 们 已 经 讨论 了 你 应 该 怎样 通过 使 用 interruption point () 和 
interruptible wait ( 函数 检测 中 断 ， 但 是 你 应 该 怎样 处 理 中 断 呢 ? 


9.2.6 ”处 理 中 断 


从 被 中 断 的 线程 的 角度 来 看 ， 一 个 中 断 只 是 一 个 thread interrupted # 
常 。 这 可 以 像 其 他 异常 一 样 进行 处 理 。 典型 的 操作 是 你 可 以 使 用 一 个 标准 的 catch 
块 来 捕获 它 。 
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try 


{ 
} 


catch (thread_interrupted&) 


do_something() ; 


handle interruption(); 


) 

这 意味 着 你 可 以 捕获 中 断 ， 用 某 些 方法 来 处 理 它 ， 然 后 继续 执行 。 如 果 你 这 样 做 ， 
另外 一 个 线程 再 次 调用 interrupt 0, ， 你 的 线程 在 调用 一 个 中 断 点 的 时 候 会 再 次 被 中 
断 。 你 可 能 想 这 样 做 如 果 你 的 线程 是 在 执行 一 系列 独立 的 任务 的 话 。 中 断 一 个 任务 会 导 
致 那个 任务 被 放弃 ， 线 程 会 继续 执行 列表 中 的 下 一 个 任务 。 

因为 thread interrupted 是 一 个 异常 , 当 调 用 能 产生 中 断 的 代码 段 的 时 候 所 有 
异常 安全 的 预防 措施 必须 被 执行 来 保证 资源 没有 被 泄露 以 及 数据 结构 保持 在 一 个 一 致 
的 状态 。 经 常 发 生 的 一 种 情况 是 让 中 断 来 结束 线程 ， 这 种 情况 下 你 只 要 让 异常 抛 出 就 可 
以 了 。 但 是 如 果 你 让 异常 传播 的 范围 超过 了 std::thread 的 构造 器 的 话 ， 
std::terminate 将 会 被 调用 ， 整 个 程序 都 会 被 终止 。 为 了 避免 被 迫 记 得 在 每 个 你 传 
递 到 interruptible thread 的 函数 中 放 一 个 catch (thread interrupted) 句 
柄 ， 作 为 替代 ， 你 可 以 将 此 catch 块 放 到 你 用 来 初始 化 interrupt flag 的 包装 器 中 。 
这 样 做 会 让 允许 中 断 蜡 常 未 被 处 理 而 传播 变 得 安全 ,因为 它 接 下 来 仅仅 会 终止 单独 一 条 
线程 。 fEinterruptible thread 构造 函数 中 的 线程 初始 化 现在 看 起 来 是 这 个 样子 。 


internal thread-std::thread([f,&pl( 
p.set value(&this thread interrupt flag); 


try 


( 
Ly 


} 


catch(thread interrupted consté) 


现在 让 我 们 看 一 个 中 断 很 有 用 的 完整 例子 。 


9.2.7 ”在 应 用 退出 时 中 断后 台 任 务 


现在 考虑 桌面 搜索 应 用 。 此 应 用 也 与 用 户 进 行 互动 ， 它 需要 监视 文件 系统 的 状态 ， 
识别 所 有 的 改变 并 且 更 新 它 的 索引 。 为 了 避免 影响 GUI 的 响应 性 , 这 种 处 理 就 留 给 基础 
线程 来 完成 。 这 个 基础 线程 需要 在 应 用 的 生命 期 始终 运行 ， 在 应 用 初始 化 的 时 候 就 启用 
它 ,然后 一 直 运 行 直到 应 用 结束 。 对 于 这 样 一 个 应 用 通常 只 有 在 机 器 被 关机 的 时 候 才 会 
RE, 因为 此 应 用 需要 始终 运行 来 保持 最 新 的 索引 。 在 任何 情况 下 , 当 应 用 结束 的 时 候 ， 
就 需要 按 顺 序 关闭 基础 线程 ， 实 现 它 的 一 种 方法 就 是 中 断 它 。 
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清单 9.13 展示 了 这 样 一 个 系统 的 线程 管理 部 分 的 一 个 简单 实现 。 


清单 9.13 ”在 后 台 监 视 文件 系统 


std: :mutex config mutex; 
std: :vector<interruptible thread> background threads; 


void background thread(int disk id) 


{ 


while (true) 


{ 
interruption_point () ; 
fs change fsc-get fs changes(disk id); +O 
if(fsc.has changes()) 


{ 
} 


update index(fsc); «- 


) 


void start background processing() 
{ 
background threads.push back( 
interruptible thread(background thread,disk 1)); 
background threads.push back( 
interruptible thread(background thread,disk 2)); 


) 


int main() 

{ 
Start background processing(); 0 
process gui until exit(); -© 
std: :unique lock<std: :mutex> lk(config mutex); 
for (unsigned i=0;i<background_threads.size() ;++1) 


{ 
} 
for (unsigned i=0;i<background_threads.size() ;++1) 


{ 
} 


background threads[i].interrupt(); +@ 


background threads[i].join(); 0 


启动 的 时 候 ， 开 始 运行 基础 线程 @。 然 后 主线 程 将 基础 线程 与 处 理 GUI 一 起 处 理 
@。 当 用 户 要 求 应 用 退出 的 时 候 ， 中 断 这 些 基 础 程序 @， 然 后 主线 程 等 待 每 个 基础 线程 
在 退出 前 完成 @。 基 础 线程 在 一 个 循环 里 聚集 ， 检 查 磁 盘 变 化 @ 并 且 更 新 索引 ©. FK 
循环 它们 通过 调用 interruption point () 检查 中 断 @。 

为 什么 你 在 等 待 前 要 中 断 所 有 线程 ? 为 什么 不 逐个 中 断然 后 再 移动 到 下 一 个 前 进 
行 等 待 ” 答 案 就 是 并 发 性 。 当 线程 被 中 断 ， 它 们 不 会 立即 结束 ， 因 为 它们 在 退出 前 必须 
前 进 到 下 一 个 中 断 点 然后 运行 析 构 函数 调用 和 蜡 常 处 理 代码 。 通 过 立即 联合 所 有 线程 ， 
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你 就 可 以 使 中 断 线程 等 待 ， 即 使 它 仍然 可 以 做 它 能 做 的 有 用 的 工作 一 一 中 断 别 的 线程 。 
你 等 待 直 到 不 再 有 任何 工作 的 时 候 〈 所 有 线程 都 被 中 断 ) ， 这 才 人 允许 所 有 线程 被 中 断 来 
并 行 地 处 理 它们 的 中 断 并 且 更 快 结束 。 

这 种 中 断 的 方法 可 以 简单 扩展 为 增加 进一步 中 断 调用 或 者 通过 一 个 具体 代码 块 来 
禁止 中 断 ， 但 是 这 将 留待 读者 考虑 。 


总 结 


本 章 ， 我 们 考虑 了 许多 “高 级 的 ”线程 管理 方法 : 线程 池 和 中 断 线程 。 你 已 经 看 到 
使 用 本 地 工作 队列 如 何 减 少 同步 管理 以 及 潜在 提高 线程 池 的 吞吐 量 ， 并 且 看 到 当 等 待 子 
任务 完成 时 如 何 运 行 队列 中 别 的 任务 来 减少 发 生死 锁 的 可 能 性 。 

我 们 也 考虑 了 许多 方法 来 允许 一 个 线程 中 断 男 一 个 线程 的 处 理 , 例如 使 用 特殊 中 断 
点 和 如 何 将 原本 会 被 中 断 阻 塞 的 函数 变 得 可 以 被 中 断 。 
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10.1 


到 目前 为 止 ， 我 主要 介绍 了 写 并 行 代码 有 哪些 可 用 到 的 工具 ， 怎 么 使 用 它们 ， 以 及 
代码 的 整体 设计 和 结构 。 本 章 将 要 介绍 软件 开发 的 另 一 个 关键 步 又 : 测试 和 调试 。 如 果 
你 想 通过 学 习 本 章 来 寻找 测试 并 行 代码 的 一 个 简单 方法 的 话 ， 那 么 ， 要 让 你 失望 了 。 测 
试 和 调试 并 行 代码 是 非常 难 的 。 本 章 主要 向 你 介绍 一 些 比较 常用 而 且 重 要 的 测试 和 调试 
技巧 。 

测试 和 调试 就 相当 于 一 个 硬币 的 两 面 一 一 测试 代码 寻找 错误 ， 调 试 代码 纠正 错误 。 
幸运 的 话 ， 你 自己 调试 出 所 有 的 错误 ， 而 不 是 让 使 用 该 应 用 的 人 发 现代 码 漏洞 。 在 我 们 
介绍 测试 和 调试 之 前 ， 重 要 的 是 理解 可 能 会 出 现 哪些 问题 ， 让 我 们 先 来 看 看 这 些 问题 。 


并 发 相关 错误 的 类 型 


在 并 发 代码 中 ， 你 几乎 会 碰 到 任何 类 型 的 错误 ， 但 是 ， 有 些 类 型 的 错误 仅 会 在 并 发 
代码 中 出 现 , 本 书 仅 关心 这 些 与 并 发 相关 的 错误 。 这 些 并 发 相关 的 错误 主要 分 为 两 大 类 。 


286 


第 10 章 ”多 线程 应 用 的 测试 与 调试 


W ”不 必要 的 阻塞 
图 ”竞争 条 件 。 
这 两 大 类 又 分 为 很 多 小 类 ， 首 先 我 们 来 看 不 必要 的 阻塞 。 


10.1.1 不 必要 的 阻塞 


不 必要 的 阻塞 是 什么 意思 ? 首先 ， 线 性 阻塞 是 指 线程 因为 要 等 待 某 些 条 件 (如 
ERIC, RARE, ASE) 无 法 继续 运行 时 所 处 的 状态 。 多 线程 代码 中 ， 常 用 这 
些 条 件 ， 而 这 些 条件 常 常 无 法 获得 满足 ， 因 此 就 出 现 了 不 必要 的 阻塞 问题 。 我 们 接 
着 又 会 提出 下 一 个 问题 : 为 什么 这 个 阻塞 是 不 必要 的 ? 因为 有 其 他 一 些 线程 在 等 竺 
该 阻塞 的 线程 执行 一 些 动作 ， 如 果 该 线程 阻塞 的 话 ， 其 他 线程 也 势必 阻塞 。 不 必要 
的 阻塞 又 分 成 以 下 几 种 。 

m Jt 


如 第 3 章 所 说 的 ， 死 锁 是 指 第 一 个 线程 在 等 待 第 二 个 线程 执行 后 才能 
继续 ， 而 第 二 个 线程 又 在 等 待 第 一 个 线程 ， 如 此 构成 一 个 线程 等 待 循环 状态 。 
如 果 你 的 线程 死 锁 了 ， 那 你 的 程序 将 无 法 继续 执行 下 去 。 在 许多 可 以 预见 的 情 
况 下 ， 多 线程 中 的 某 一 线程 是 负责 与 用 户 接口 交互 的 ， 在 死 锁 情况 下 ， 用 户 接 
口 会 停止 应 答 。 而 在 其 他 情况 下 ， 用 户 接口 仍 会 应 答 ， 只 不 过 有 些 必要 的 任务 
无 法 得 到 执行 ， 如 不 会 返回 搜索 结果 或 者 不 会 打印 文件 等 。 

活 锁 一 一 当 第 一 个 线程 等 待 第 二 个 线程 时 ， 而 这 第 三 个 线程 又 在 等 第 一 个 线程 
情况 时 ， 活 锁 类 似 于 死 锁 。 活 锁 与 死 锁 的 关键 不 同 在 于 等 待 过 程 不 是 一 个 阻塞 
状态 而 是 一 个 不 断 的 循环 检测 状态 ， 如 自 旋 锁 。 严 重 时 ， 活 锁 的 症状 就 像 死 锁 
(应 用 不 会 执行 任何 进程 ), 不 同 仅 在 于 CPU 此 时 的 利用 率 非 常 的 高 ,， 因为 现在 
还 在 不 断 的 运行 检测 ， 只 因 相 互 等 待 而 阻塞 。 不 太 严 重 时 ， 当 某 个 随机 事件 发 
生 时 ， 活 锁 可 能 会 被 解锁 ， 但 是 ， 活 锁 会 导致 任务 较 长 时 间 得 不 到 执行 ， 并 且 
在 这 期 间 CPU HARG. 

在 VO 或 外 部 输入 上 的 阻塞 一 一 当 你 的 线程 阻塞 是 因为 等 待 某 外 部 输入 而 无 法 
继续 执行 ， 可 能 这 个 外 部 输入 永远 都 不 到 来 ， 那 么 这 种 阻塞 就 称 之 为 基于 等 待 
VO 或 其 他 外 部 输入 的 阻塞 。 因 此 ， 不 希望 出 现 一 个 线程 因 等 待 外 部 输入 而 阻 
塞 ， 其 他 线程 有 因为 要 等 待 这 个 线程 的 运行 而 阻塞 的 情况 出 现 。 


上 面 简要 的 介绍 了 几 种 不 必要 的 阻塞 类 型 ， 那 么 什么 是 竞争 条 件 呢 ? 


10.1.2 ”竞争 条 件 


竞争 条 件 是 多 线程 代码 中 的 问题 最 常见 的 原因 一 一 许多 死 锁 和 和 活 锁 实际 上 是 竞争 
条 件 的 表现 。 并 不 是 所 有 的 竞争 条 件 都 是 有 问题 的 一 竞争 条 件 发 生 的 时 间 取决 于 各 个 独 
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立 线程 操作 的 先后 顺序 。 许 多 竞争 条 件 是 有 益 的 。 例 如 ， 到 底 哪个 线程 来 处 理 任务 队列 
中 的 下 一 个 任务 是 不 确定 的 。 然 而 ， 许 多 并 发 错误 的 产生 是 由 于 竞争 条 件 。 竞 争 条 件 常 
常 产生 下 面 几 种 错误 类 型 。 

图 ”数据 竞争 一 一 数据 竞争 是 一 种 特殊 的 竞争 条 件 。 因 为 没有 同步 好 对 某 个 共享 内 

存 的 并 行 访问 ， 因 此 ， 数 据 竞争 会 造成 未 定义 的 操作 出 现 。 在 第 5 章 我 们 学 习 
C+4+ 内 存 模 型 时 ， 我 介绍 过 数据 竞争 。 当 错误 地 使 用 原子 操作 来 同步 线程 或 者 
想 通 过 共享 数据 来 避免 互 斥 元 死 锁 时 ， 常 常会 发 生 数据 竞争 。 

加 ”破坏 不 变量 一 一 常常 表现 为 悬挂 指针 ( 因为 另 一 个 线程 删除 了 被 访问 的 数据 )、 
随机 存储 损坏 ( 线程 由 于 局 部 更 新 而 造成 的 读 取 数 据 不 一 致 ) 或 者 双 闲 状态 ( 如 
当 两 个 线程 从 同一 队列 中 弹出 相同 的 值 ， 并 且 这 两 个 线程 因此 而 删除 一 些 相关 
数据 ) 等 。 破 坏 不 变量 常 指 不 变量 在 时 间或 数值 上 的 改变 。 如 果 多 个 线程 要 求 
以 特定 的 顺序 执行 ， 那 么 不 正确 同步 可 能 会 产生 由 于 线程 执行 顺序 错误 而 引起 
的 竞争 条 件 。 

加 ”生存 期 问题 一 - 人们 常常 会 将 生存 期 间 题 归结 为 破坏 不 变量 问题 ， 但 实际 上 生 
存 期 间 题 是 竞争 条 件 产 生 的 另 一 个 独立 的 问题 分 类 。 在 这 个 分 类 中 的 错误 的 基 
本 问题 是 线程 会 超时 访问 某 些 数据 ， 而 这 些 数据 可 能 已 经 被 删除 、 销 毁 或 者 访 
问 的 内 存 其 实 已 经 被 另 一 个 对 象 重 用 。 当 一 个 线程 要 参考 某 一 局 部 变量 ， 而 
这 个 局 部 变量 已 经 不 在 该 线程 访问 能 力 之 肉 了， 这样 就 会 造成 生存 期 问题 。 
当 线 程 的 生存 时 间 与 它 可 以 操作 的 数据 之 间 没 有 某 种 限制 规则 时 ， 那 么 ， 就 
极 有 可 能 出 现在 线程 结束 之 前 该 数据 就 已 被 销毁 ， 而 造成 线程 访问 错误 的 问 
Fi, 如 果 在 线程 中 调用 join () 来 让 数据 等 到 线程 完成 后 再 销毁 ， 那 你 需要 保 
证 当 发 生 异 常 时 ,可 以 跳 过 join 0 函数 的 执行 ,这 是 线程 异常 的 基本 安全 保 
障 ， 

竞争 条 件 是 问题 杀手 。 死 锁 和 活 锁 会 导致 任务 长 时 间 得 不 到 执行 。 通 常 ， 你 可 
以 添加 一 个 调试 器 来 运行 区 分 哪些 线程 陷入 死 锁 或 者 活 锁 ， 并 且 哪 些 并 发 对 象 是 相 
互 矛盾 的 。 

在 整个 代码 的 任何 地 方 都 可 能 出 现 上 面 介绍 的 数据 竞争 、 破 坏 变量 和 生命 周期 的 问 
题 的 症状 〈 如 随机 崩溃 或 者 不 正确 的 输出 ) ， 代 码 可 能 会 重 写 后 面 其 他 程序 可 能 会 用 到 
的 内 存 ， 导 致 编译 出 错 。 编 译 给 出 的 错误 定位 往往 完全 与 出 错 代码 无 关 ， 可 在 程序 执行 
很 久 后， 才能 暴露 该 错误 。 这 类 错误 往往 是 由 共享 系统 内 存 造 成 的 ， 就 算 你 小 心 权 必 地 
试图 指定 某 线程 访问 某 数据 ， 并 且 保 证 正确 同步 ， 但 是 ， 任 何 线程 都 有 可 能 重 写 应 用 程 
序 中 其 他 线程 需要 使 用 的 数据 。 

至 此 ， 我 们 简要 明确 了 我 们 将 要 遇 到 的 错误 类 型 ， 下 面 让 我 们 看 看 ， 我 们 该 怎样 来 
定位 错误 实例 ， 并 解决 它们 。 
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10.2 定位 并 发 相关 的 错误 的 技巧 


在 前 面 的 内 容 中 , 我们 学 习 了 在 代码 中 可 能 会 遇 到 的 并 发 相关 的 错误 类 型 ， 以 及 这 
些 错 误 的 表现 形式 。 对 上 述 知识 有 所 了 解 后 ， 你 可 以 检查 你 的 代码 ， 并 找 出 错误 可 能 出 
现在 哪里 ， 你 可 以 先 尝 试 确定 某 段 代码 是 否 有 错 。 

也 许 最 显然 最 直接 的 方法 ， 就 是 查看 代码 。 这 虽然 看 似 明 显 ， 但 实际 上 是 很 难 贯 彻 
的 。 当 你 阅读 自己 刚 写 的 代码 时 ， 很 容易 读 成 你 想 要 写 的 ， 而 非 你 真正 写 的 。 相 似 地 ， 
如 果 要 你 阅读 他 人 写 的 代码 时 ， 你 快速 阅读 可 能 定位 和 解决 一 些 简单 的 问题 ， 一 些 重大 
或 比较 隐 星 的 问题 ， 则 需要 我 们 花 大 量 的 时 间 去 梳理 代码 ， 考 虑 可 能 出 现 的 并 行 问题 和 
非 并 行 问题 。 在 下 面 的 代码 中 ， 我 们 将 具体 问题 具体 对 待 。 

就 算是 检阅 你 自己 的 代码 ， 你 还 是 可 能 会 漏 掉 一 些 错误 。 因 此 ， 无 论 何 时 ， 你 都 要 
确保 你 的 代码 可 以 执行 ， 即 使 代码 无 法 顺利 执行 ， 你 也 要 保持 平和 的 心态 。 因 此 ， 我 们 
会 介绍 一 下 与 检阅 代码 相关 的 一 些 多 线程 测试 和 调试 技巧 。 


10.2.1 审阅 代码 以 定位 潜在 的 错误 


正如 前 面 提 到 的 ， 当 检阅 多 线程 代码 来 纠正 并 行 相关 的 错误 时 ， 彻 底 仔细 地 阅读 非 
党 重要 ， 要 像 一 把 细 齿 梳子 一 样 仔细 地 阅读 代码 。 如 果 可 能 让 他 人 帮 你 检阅 你 的 代码 ， 
因为 他 们 没有 参与 代码 的 编写 ， 他 们 不 得 不 想 清楚 代码 是 如 何 工 作 的 ， 因 此 ， 会 发 现 很 
多 和 遗 漏 的 错误 。 这 需要 代码 的 阅读 者 有 充足 的 时 间 来 仔细 负责 地 检阅 代码 ， 而 不 是 简单 
快速 地 过 一 过 。 大 多 数 并 行 错 误 不 是 简单 快速 的 扫 视 代码 所 能 发 现 的 ， 这 些 错 误 往往 需 
要 微妙 的 时 机 才 会 出 现 。 

如 果 你 让 你 的 同事 帮 你 检阅 你 的 代码 ， 这 个 代码 对 他 来 说 是 完全 陌生 的 。 因 此 ， 他 
们 会 从 不 同 的 视角 来 看 问题 ， 并 指出 一 些 你 未 发 现 的 错误 。 如 果 你 找 不 到 同事 帮 你 检阅 
代码 ， 你 可 以 找 朋 友 帮 忙 ， 甚 至 将 代码 发 到 网 络 上 寻求 帮助 。 如 果 你 实在 找 不 到 人 帮 你 
检阅 代码 ， 或 者 ， 他 们 也 无 法 找 出 问题 ， 别 急 ， 你 还 可 以 这 么 做 。 对 于 初学 者 来 说 ， 将 
代码 搁置 一 段 时 间 ， 去 做 其 他 事情 ， 如 编写 该 程序 的 其 他 部 分 、 读 书 、 散 步 等 。 在 这 
段 时 间 内 ， 当 你 集中 精神 做 其 他 事 时 ， 你 的 潜意识 还 在 想 着 这 个 问题 。 同 时 ， 当 你 重 
新 回 到 该 代码 时 ， 代 码 已 经 不 那么 熟悉 了 ， 这 样 你 可 能 就 会 以 一 种 不 同 的 视角 来 检阅 
你 的 代码 。 

让 别人 审阅 代码 的 替代 方法 是 自己 审阅 。 一 个 有 用 的 技巧 是 试图 解释 它 是 如 何 工作 
的 细节 给 别人 。 这 个 别人 甚至 可 以 不 是 实体 的 人 ， 如 布 偶 能 或 橡胶 鸡 ， 我 个 人 认为 编写 
详细 的 注释 极 有 帮助 。 你 要 解释 , 每 一 行 代码 有 什么 作用 , 会 发 生 什么 , 访问 的 数据 等 。 
你 要 不 断 地 自我 提问 并 解释 回答 。 通 过 不 断 地 问 自 己 这 些 问题 ， 并 仔细 思考 它 的 答案 ， 
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问题 常常 自己 就 会 暴露 出 来 ， 你 会 发 现 这 真是 一 个 难以 置信 的 发 现 错误 的 有 效 方法 。 这 
些 问题 对 于 检阅 任何 代码 都 是 有 用 的 ， 而 不 仅 对 于 检阅 你 自己 的 代码 。 


审阅 多 线程 代码 时 需要 思考 的 问题 


正如 我 说 的 , 代码 阅读 者 在 阅读 代码 时 思考 一 些 与 代码 相关 的 特定 问题 是 非常 有 用 
的 。 这些 问 题 会 使 阅读 者 集中 注意 力 到 一 些 代码 相 关 的 细节 上 ， 并 且 帮 助 发 现 一 些 潜在 
的 错误 。 下 面 列 出 一 些 具体 的 而 非 全 部 的 ， 我 喜欢 问 的 一 些 问 题 。 你 也 可 以 找到 其 他 一 
些 你 比较 关注 的 问题 。 不 再 多 说 了 ， 先 将 这 些 问 题 列 出 以 便 参考 。 

四 ”哪些 数据 是 需要 保护 ， 防 止 并 行 访问 的 ? 

如 何 保证 你 的 数据 是 被 保护 的 ? 
此 时 其 他 线程 执行 到 代码 的 何 处 ? 
该 线程 用 的 是 哪些 信号 量 ? 
其 他 线程 持 有 哪些 信号 量 ? 
该 线程 各 操作 之 间 有 先后 顺序 的 要 求 吗 ? 在 其 他 线程 中 存在 这 样 的 问题 吗 ? 这 
些 要 求 如 何 强制 执行 ? 
E ”该 线程 载 入 的 数据 是 否 有 效 ? 该 数据 是 否 已 经 被 其 他 线程 修改 了 ? 
图 ”如 果 你 假设 其 他 线程 可 能 正在 修改 该 数据 ， 那 么 可 能 会 导致 什么 样 的 后 果 以 及 
如 何 保 证 这 样 的 事情 永 不 发 生 ? 

最 后 一 个 问题 是 我 最 喜欢 问 的 问题 ， 因 为 它 确实 能 帮 有 我 理 清楚 线程 之 间 的 关系 。 通 
过 假设 某 行 代码 存在 错误 ， 你 就 可 以 像 个 侦探 一 样 追 查 原因 。 为 了 说 服 你 自己 ， 代 码 没 
有 错误 , 你 需要 考虑 到 所 有 情况 和 可 能 排序 。 当 数据 在 其 生命 期 内 受 多 个 信号 量 保护 时 ， 
这 个 方法 非常 有 用 ， 例 如 ， 使 用 第 6 章 中 给 出 对 线程 安全 序列 ， 这 个 安全 的 队列 的 头 和 
尾 对 应 不 同 的 信号 量 ， 你 必须 要 保证 线程 持 有 的 另 一 个 信号 量 不 会 访问 相同 的 队列 元 
素 。 这 个 问题 还 会 使 得 对 公有 数据 或 者 其 他 代码 能 够 很 容易 得 到 该 数据 指针 或 引用 的 私 
有 数据 进行 特定 审查 的 问题 更 加 重要 和 明确 。 

列举 的 倒数 第 二 个 问题 同样 也 很 重要 ， 因 为 它 解决 了 一 个 常常 会 犯 的 简单 错误 ， 如 
果 你 释放 后 再 重新 获取 该 信号 量 你 必须 假设 其 他 线程 已 经 修改 了 该 共享 数据 。 很 明显 ， 
如 果 互 斥 锁 因为 它们 对 于 对 象 来 说 是 内 部 的 不 是 立即 可 见 的 一 你 可 能 在 不 知 不 觉 中 就 
那么 做 了 。 在 第 6 BEM, 可 以 看 到 当 函 数 提供 线程 安全 数据 结构 时 太 细 粒度 的 时 候 ， 是 
如 何 导致 竞争 条 件 以 及 错误 的 。 但 是 ， 对 于 一 个 非 线程 安全 的 栈 来 说 ， 栈 可 能 会 被 多 个 
线程 并 行 访问 ， 让 top () 和 pop O 操作 独立 开 来 是 必要 的 ， 那 么 ， 共 享 数据 被 修改 的 
情况 将 不 再 会 出 现 ， 因 为 内 部 互 斥 元 的 锁 在 这 两 个 调用 之 间 就 已 经 被 释放 了 ， 因 此 ， 另 
一 个 线程 就 可 以 修改 栈 了 。 第 6 章 中 ,解决 的 办 法 是 将 两 个 操作 结合 起 来 ， 所 以 它们 都 
在 同一 互 斥 锁 的 保护 下 执行 ， 从 而 消除 了 潜在 的 竞争 条 件 。 

那么 ， 让 我 们 来 回顾 一 下 你 自己 的 代码 (或 者 他 人 的 代码 ) ， 你 要 确保 没有 代码 错 
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误 。 你 该 怎样 测试 你 的 代码 确保 无 错 或 否定 你 代码 无 错 的 信念 ， 只 有 试 过 才 知 道 。 


10.2.2 通过 测试 定位 并 发 相关 的 错误 


开发 单线 程 应 用 时 ， 应 用 测试 比较 简单 耗 时 。 首 先 ， 你 需要 区 分 所 有 可 能 的 输入 数 
据 集 (至少 包 括 一 些 典 型 的 输入 测试 集 ) 并 且 对 这 些 输 入 数据 集 进行 测试 。 如 果 应 用 
程序 能 够 正确 执行 并 且 产 生 正确 的 输出 ， 说 明 这 个 应 用 程序 对 于 给 定 的 输入 集 能 够 正 
常 运行 。 如 果 测 试 到 错误 状态 ， 处 理 则 会 比 正确 运行 的 情况 复杂 。 但 是 ， 基 本 思想 是 
相同 的 一 一 建立 初始 化 条 件 执行 应 用 程序 。 

测试 多 线程 代码 相对 于 单线 程 来 说 难得 多 ， 因 为 合理 的 调度 线程 是 不 确定 的 ， 因 此 
线程 调度 的 差异 会 导致 运行 的 变化 。 因 此 ， 即 使 应 用 程序 运行 同一 组 输入 数据 ， 如 果 代 
码 中 潜伏 有 竞争 条 件 的 话 , 仍然 有 可 能 会 导致 有 时 运行 正确 有 时 运行 出 错 。 因 为 有 潜在 
的 竞争 条 件 并 不 意味 着 代码 执行 总 是 失败 ， 仅 仅 是 有 时 有 可 能 会 失败 。 

鉴于 固有 的 难以 再 现 并 发 相关 的 错误 ， 因 此 ， 需 要 仔细 地 设计 测试 程序 。 你 希望 每 
次 测试 能 够 确定 问题 可 能 存在 的 最 少 的 代码 ， 那 么 当 测试 失败 时 ， 你 就 可 以 更 好 地 隔离 
出 错 代 码 一 一 测试 并 行 队列 最 好 能 够 直接 测试 并 行 压 栈 和 出 栈 工 作 而 不 是 测试 使 用 并 
行 队列 的 整个 代码 块 。 这 样 有 助 你 思考 该 怎样 设计 测试 代码 一 一 参考 本 章 后 面 的 易 测 性 
设计 小 节 中 的 内 容 。 

我 们 值得 通过 测试 消除 并 发 来 证 明 问 题 是 并 发 相关 的 。 如 果 你 让 所 有 程序 运行 在 一 
个 线程 时 出 错 , 该 错 只 是 一 个 普通 的 错误 而 非 一 个 并 发 相关 的 错误 。 追踪 错误 的 初始 发 
生 位 置 而 不 是 被 你 的 测试 工具 测试 发 现 的 错误 位 置 是 非常 重要 的 。 这 是 因为 即使 错误 发 
生 在 你 应 用 的 多 线程 部 分 ， 也 并 不 意味 着 它 就 是 并 发 相关 的 。 如 果 你 使 用 线程 池 来 管理 
并 发 等 级 ,通常 你 可 以 通过 设置 配置 参数 来 指定 工作 线程 。 如 果 你 手动 地 管理 线程 ， 你 
就 需要 修改 代码 以 便 使 用 单个 线程 测试 来 进行 测试 。 一 方面 ,你 可 以 将 你 的 线程 减少 到 
一 个 ， 这 样 就 可 以 根除 并 发 ， 另 一 方面 ， 如 果 在 单 核 系统 中 没有 错误 (即使 是 一 个 多 线 
程 应 用 )， 但 是 在 多 核 系统 或 多 处 理 器 系统 中 出 错 ， 那 么 就 是 竞争 条 件 错误 和 可 能 同步 
或 内 存 顺 序 错 误 。 

比 代码 结构 更 加 重要 的 是 测试 代码 的 并 发 性 ， 测 试 代 码 的 结构 仅仅 跟 测 试 环境 
一 样 重要 。 如 果 你 连续 用 一 个 测试 实例 来 测试 并 发 队列 ， 你 需要 考虑 以 下 各 种 不 同 
的 应 用 场景 。 

图 ”一 个 线程 在 自身 队列 上 调用 push () 或 pop() 来 验证 该 队列 工作 在 基础 级 别 。 

W ”在 一 个 空 队列 上 一 个 线程 调用 push () 同时 另 一 个 线程 调用 pop () 。 

E 在 一 个 空 队 列 上 多 个 线程 调用 push () 。 

E 在 一 个 满 队 列 上 多 个 线程 调用 Push () 。 

加 在 一 个 空 队列 上 多 个 线程 调用 Pop () 。 
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在 一 个 满 队 列 上 多 个 线程 调用 pop () 。 

在 一 个 特定 的 满 队 列 上 多 个 线程 调用 pop () ， 该 队列 的 总 长 度 不 够 ,无 法 满足 
所 有 线程 。 i 

加 ”在 一 个 空 队列 上 同时 有 多 个 线程 调用 push () 和 一 个 线程 调用 pop () 。 

W 在 一 个 满 队 列 上 同时 有 多 个 线程 调用 push () 和 一 个 线程 调用 pop () 。 
E 
L| 


在 一 个 空 队列 上 同时 有 多 个 线程 调用 push () 和 多 个 线程 调用 PoP () 。 
在 一 个 满 队列 上 同时 有 多 个 线程 调用 push () 和 多 个 线程 调用 pop () 。 

考虑 完 上 述 所 有 场景 或 者 更 多 场景 后 ， 接 着 你 需要 考虑 关于 测试 环境 的 附加 因子 。 

W “在 每 个 场景 中 ， 多 线程 是 什么 意思 (3、4、1024? )。 

E 系统 是 否 有 足够 的 处 理 核 来 为 每 个 运行 线程 分 配 一 个 核 。 

图 ”测试 程序 需要 在 哪 种 结构 的 处 理 器 上 运行 。 

图 ”你 将 怎样 为 你 测试 的 并 行 部 分 确定 合适 的 时 间 顺 序 。 

对 于 特殊 情况 需要 考虑 附加 因子 。 鉴 于 对 以 上 四 种 环境 的 考虑 ,第 一 种 和 最 后 一 种 
环境 会 影响 测试 代码 自身 的 结构 (参见 102.5 节 )， 其 他 两 种 与 正在 使 用 的 物理 测试 系 
统 有 关 。 使 用 到 的 线程 数 与 特定 的 被 测试 代码 有 关 ， 但 是 ， 可 以 通过 构建 测试 代码 的 不 
同 的 方式 来 得 到 合理 的 时 间 顺 序 表 。 在 我 们 学 习 这 些 技术 之 前 ， 证 我 们 来 看 看 怎样 设计 
一 个 便于 测试 的 应 用 代码 。 


10.2.3 ”可 测试 性 设计 


测试 多 线程 代码 是 困难 的 ,所 以 你 会 想 怎样 才能 使 代码 易于 测试 呢 ? 你 能 做 的 最 重 
要 的 事情 之 一 就 是 设计 易于 测试 的 代码 。 现 有 设计 易于 测试 代码 的 技术 大 都 用 于 单线 程 
代码 ， 但 是 ， 其 中 许多 技术 也 同样 可 以 应 用 多 线程 。 通 常 ， 做 到 以 下 几 点 后 ， 代 码 就 比 
较 易 于 测试 了 。 

E 每 个 函数 功能 和 类 的 划分 清晰 明确 。 
函数 扼要 简洁 。 
你 的 测试 代码 可 以 完全 控制 你 的 被 测试 代码 的 周围 的 环境 。 
被 测试 的 需要 特定 操作 的 代码 应 该 集中 在 一 块 而 不 是 分 散在 整个 系统 中 。 
在 你 写 测试 代码 之 前 你 要 先 考 虑 如 何 测 试 代码 。 

所 有 以 上 提 到 的 都 可 以 应 用 在 多 线程 代码 中 。 事 实 上 ， 我 认为 上 述 几 点 更 多 的 应 用 
于 解决 多 线程 代码 的 易 测 性 而 非 单线 程 代码 的 易 测 性 。 上 述 最 后 一 条 非常 重要 ， 即 使 你 
编写 应 用 代码 之 前 ， 此 时 还 远 没有 到 写 测试 代码 的 那 一 步 ， 在 你 编写 应 用 代码 之 前 也 有 
必要 考虑 怎样 测试 它 一 一 使 用 什么 样 的 输入 ， 哪 些 条 件 下 可 能 会 出 错 ， 怎 样 找 到 代码 洲 
在 的 错误 等 。 

设计 易于 测试 的 并 行 代码 最 好 的 方法 之 一 就 是 消除 并 发 。 如果 你 可 以 将 代码 分 割 成 
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多 个 部 分 , 在 一 个 单线 程 内 由 这 些 部 分 来 负责 要 操作 的 通信 数据 与 多 个 线程 之 间 的 通信 
路 径 ， 这 样 ， 你 就 极 大 地 减少 了 问题 。 操 作 被 一 个 单线 程 访问 的 数据 时 的 这 些 应 用 部 分 
可 以 使 用 正常 的 单线 程 技术 来 进行 测试 。 这 样 ， 那 些 难以 测试 的 用 于 处 理 线程 之 间 通 信 
和 确保 一 个 时 间 内 仅 有 一 个 线程 访问 特定 数据 块 的 并 发 代码 部 分 就 变 得 比较 少 , 测试 出 
现 错误 时 ， 也 更 加 容易 进行 追踪 错误 源头 。 

例如 ， 如 果 你 的 应 用 被 设计 成 一 个 多 线程 的 的 状态 机 ， 那 么 你 就 可 以 将 它 分 解 
成 多 个 部 分 。 用 于 为 每 个 可 能 的 输入 集 确保 状态 转换 和 操作 的 正确 性 的 线程 的 状态 
逻辑 可 以 通过 单线 程 技术 独立 的 进行 测试 ， 并 且 通 过 测试 工具 提供 的 测试 输入 集 ， 
可 以 同样 应 用 到 其 他 线程 。 接 着 ， 通 过 测试 代码 中 特别 设计 多 并 发 线程 和 简单 的 状 
态 逮 辑 ， 核 心 状态 机 和 确保 各 事件 按 正确 的 顺序 到 达 正 确 的 线程 的 信息 路 由 的 代码 
可 以 独立 的 进行 测试 。 

可 选 地 ， 如 果 你 将 代码 分 解 成 多 个 代码 块 ， 读 共享 数据 /迁移 数据 /更 新 共享 数据 ， 
你 可 以 使 用 所 有 的 单线 程 技术 来 测试 迁移 数据 代码 块 部 分 ， 因 为 此 时 这 部 分 代码 仅 是 一 
个 单线 程 代码 。 测试 一 个 多 线程 迁移 困难 的 问题 可 以 降级 为 测试 读 共享 数据 块 和 更 新 共 
享 数据 块 中 的 一 个 ， 哪 个 简单 选 哪 个 。 

需要 注意 的 是 库 函 数 调用 能 够 使 用 内 部 变量 来 存储 状态 ， 然 后， 如 果 多 个 线程 使 用 
相同 的 库 函 数 调用 集 在 多 线程 之 间 实 现 共享 。 因 为 代码 访问 共享 数据 不 是 立即 表现 出 来 
的 ， 因 此 ， 多 线程 的 共享 还 存在 一 些 问题 。 然 而 ， 随 着 你 对 这 些 库 函 数 调用 的 学 习 ， 多 
线程 共享 仍然 是 个 问题 。 这 时 ， 你 要 么 添加 适当 的 保护 和 同步 或 者 使 用 可 替代 的 对 于 多 
线程 的 并 行 访问 来 说 安全 函数 。 

设计 多 线程 的 易 测 性 比 你 构建 代码 以 减少 用 来 处 理 并 发 相关 的 问题 代码 和 注意 对 
于 一 些 非 线程 安全 的 库 函 数 调用 代码 的 代码 量 来 说 更 为 重要 。 在 浏览 代码 时 ， 记 得 问 一 
下 自己 10.2.1 小 节 中 的 问题 是 非常 有 用 的 。 尽 管 这 些 问题 可 能 不 是 直接 关于 测试 或 易 测 
ES EUR, BI TEE RR ee ee 
那么 ， 做 出 的 设计 选择 可 能 不 同 以 使 测试 更 加 简单 。 

既然 我 们 学 习 了 合理 的 设计 代码 可 以 使 测试 变 得 更 加 容易 ， 潜 在 地 修改 代码 来 

从 “单线 程 部 分 ”( 这 个 单线 程 仍 可 以 通过 并 发 模块 与 其 他 线程 进行 交互 ) 隔离 “并 
发 部 分 ”( 比如 线程 安全 容器 或 状态 机 事件 逻辑 )， 下 面 让 我 们 来 学 习 测 试 并 发 代码 
的 相关 技术 。 


10.2.4 多 线程 测试 技术 


你 需要 思考 你 想 要 测试 的 场景 并 且 编 写 一 些小 的 代码 来 测试 函数 功能 。 那 么 ， 你 怎 
样 确保 那些 存在 潜在 的 问题 的 时 间 调 度 通过 小 的 测试 练习 解决 它 的 潜在 错误 呢 ? 
事实 上 ， 有 许多 方法 可 以 做 到 这 点 ， 如 暴力 测试 或 者 压力 测试 。 
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1， 暴 力 测试 〈brute-force testing) 


暴力 测试 的 核心 思想 是 穷 举 所 有 可 能 情况 看 代码 是 否 能 够 正常 而 不 出 现 错误 。 最 典 
型 的 方法 是 多 次 运行 代码 ， 并 且 尽 可 能 地 一 次 运行 多 个 线程 。 如 果 一 个 错误 仅 在 多 个 线 
程 以 某 一 特定 顺序 运行 时 出 现 ， 那 么 运行 的 代码 越 多 ， 出 错 的 可 能 性 就 越 大 。 如 果 你 仅 
测试 一 次 并 且 通 过 了 测试 ， 你 可 能 自信 地 以 为 代码 没有 问题 ， 能 够 工作 。 如 果 你 一 批 运 
行 十 次 并 且 每 次 都 能 通过 测试 ， 你 就 会 更 加 自信 。 如 果 你 测试 了 十 亿 次 ， 并 且 每 次 都 通 
过 测试 ， 那 你 就 会 对 你 的 代码 自信 无 比 。 

你 的 自信 程度 取决 于 你 通过 测试 的 次 数 。 如 果 你 的 测试 结果 非常 精确 ， 测 试 甚至 可 
以 精确 地 概括 到 线程 安全 队列 的 话 ， 这 样 的 穷 举 测试 会 让 你 对 自己 的 代码 无 比 自信 ， 另 
一 方面 ， 如 果 被 测试 的 代码 非常 的 多 ， 可 能 的 排列 数 非 常 多 ， 运 行 即使 十 亿 次 也 仅 会 产 
生 一 点 点 自信 。 

穷 举 测试 的 缺点 是 它 可 能 会 让 人 产生 盲目 的 自信 。 可 能 你 编写 的 测试 环境 不 会 产生 
错误 ， 就 算 你 运行 多 次 也 不 会 出 现 错误 ， 但 是 ， 换 一 个 稍微 不 同 的 环境 就 会 每 次 测试 都 
出 错 。 最 坏 的 情况 就 是 在 你 的 测试 系统 中 不 会 出 现 有 问题 的 测试 环境 因为 你 测试 是 在 一 
个 特殊 的 环境 。 除 非 你 的 代码 运行 的 环境 与 你 代码 测试 运行 的 环境 一 模 一 样 ， 并 且 相应 
的 硬件 和 操作 系统 也 不 会 引起 任何 错误 出 现 。 

这 里 给 出 的 一 个 典型 的 例子 就 是 在 一 个 单 处 理 系 统 上 测试 一 个 多 线程 应 用 。 因 为 每 
个 线程 都 要 求 运行 在 同一 个 处 理 器 上 ， 所 有 的 任务 都 是 自动 串 行进 行 的 ， 那 么 在 多 处 理 
器 上 可 能 遇 到 的 许多 竞争 条 件 和 双向 缓存 问题 在 单 处 理 器 系统 中 都 不 复 存在 了 。 这 不 仅 
仅 是 变量 的 问题 ; 不 同 的 处 理 器 体系 结构 产生 不 同 的 同步 和 设备 时 序 问题 。 例如 , 在 x86 
和 x86-64 体系 结构 上 ， 自 动 加 载 的 操作 通常 是 一 样 的 , 但 是 是 否 标 识 memory_order_ 
relaxed 或 者 memory order seq cst 是 不 同 的 (参见 5.3.3 节 )。 这 意味 着 那些 编 
写 的 代码 可 以 在 放松 内 存 顺序 的 x86 系统 上 正确 运行 , 而 在 有 着 精确 时 序 操作 指令 集 系 
统 如 SPARC 系统 中 会 运行 失败 。 

如 果 你 需要 你 的 应 用 能 够 方便 的 在 多 个 目标 系统 运行 , 那么 在 这 多 种 系统 上 进行 一 
些 有 代表 性 实例 的 测试 是 非常 重要 的 。 这 就 是 我 为 什么 在 10.2.2 节 测 试 环境 中 列 出 被 使 
用 的 处 理 器 体系 结构 的 原因 。 

避免 潜在 的 盲目 自信 的 关键 是 成 功 地 进行 穷 举 测试 。 这 需要 仔细 考虑 测试 设计 ， 不 
仅 考虑 与 被 测 代码 单元 的 选择 ， 还 要 考虑 测试 工具 的 设计 和 选择 测试 环境 。 你 需要 保证 
尽 可 能 多 的 方法 测试 代码 ， 也 要 尽 可 能 考虑 所 有 可 行 的 线程 交互 。 

尽管 穷 举 测试 确实 能 给 你 带 来 自信 ， 但 是 ， 穷 举 测试 无 法 保证 找到 所 有 问题 。 这 里 
介绍 一 种 可 以 找到 所 有 问题 的 技术 ， 我 们 称 之 为 组 合 仿真 测试 。 这 种 测试 技术 要 求 你 花 
时 间 将 它 应 用 到 你 的 代码 和 合适 的 软件 中 去 。 
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2. 组 合 仿真 测试 


这 有 点 绕 嘴 ， 因 此 我 最 好 先 解释 一 下 我 的 意思 。 组 合 仿真 测试 是 指 在 一 种 特殊 的 仿 
真 代码 真实 运行 环境 的 软件 上 运行 你 的 代码 。 你 将 注意 到 这 个 软件 允许 你 在 一 个 单 物理 
计算 机 上 运行 多 个 虚拟 机 ,这些 虚拟 机 和 硬件 的 特性 是 被 上 层 软件 竞争 调用 。 不 同 于 仿 
真 系统 ， 模 拟 软件 能 够 记录 线程 数据 访问 、 锁 、 原 子 操作 等 的 先后 顺序 。 然 后 ， 使 用 
C++ 内 存 模型 的 规则 重复 运行 每 组 允许 的 组 合 操作 来 识别 竞争 条 件 和 死 锁 。 

虽然 如 此 全 面 的 测试 组 合 能 够 保证 找到 系统 中 的 所 有 错误 ， 但 是 ， 许 多 小 的 错误 ， 
往往 需要 花费 大 量 的 时 间 来 发 现 它 ， 因 为 组 合 操作 的 排列 数 会 随 着 线程 数 和 每 个 线程 的 
操作 数 增长 而 呈现 指数 增长 的 趋势 。 因 此 组 合 测试 技术 最 好 保留 到 对 代码 片段 进行 精细 
测试 时 再 用 ， 而 不 是 应 用 对 整个 应 用 程序 的 测试 。 组 合 测试 的 一 个 明显 的 缺点 就 是 它 需 
要 依赖 于 仿真 软件 处 理 你 代码 中 操作 的 能 力 。 

组 合 测试 技术 可 以 用 来 在 正常 条 件 下 反复 测试 你 的 代码 , 但 是 ,这 种 技术 可 能 会 泼 
查 一 些 错误 ， 因 此， 你 需要 一 种 技术 ,这 种 技术 可 以 让 你 在 各 种 特定 的 条 件 下 反复 测试 
你 的 代码 。 有 这 样 一 种 技术 存在 吗 ? 

使 用 在 测试 运行 时 发 现 问题 的 库 函 数 就 是 这 样 一 种 技术 。 


3. 使 用 特殊 的 库 函 数 来 检测 测试 暴露 出 的 问题 


尽管 这 种 技术 无 法 提供 全 面 检查 组 合 的 模拟 测试 ， 但 是 ， 你 可 以 使 用 一 些 特别 的 库 
函数 同步 基本 单元 来 找到 大 部 分 错误 ， 这 些 同 步 基 本 单元 如 互 斥 元 、 锁 和 条 件 变量 等 。 
例如 ， 常 用 的 要 求 对 一 块 共享 数据 使 用 互 斥 锁 。 当 你 访问 数据 时 ， 如 果 检 测 到 互 斥 锁 ， 
就 可 以 证 实 当 访问 数据 时 ， 调 用 线程 已 将 该 互 斥 元 锁 住 了 并 且 报 告 访 问 失败 。 通 过 标记 


你 的 共享 数据 ， 你 可 以 使 用 库 函 数 来 检查 数据 共享 。 


如 果 有 一 个 特殊 线程 一 次 拥有 多 个 互 斥 元 ， 应 用 库 函 数 还 可 以 记录 锁 的 顺序 。 如 果 
另 一 个 线程 在 不 同 的 时 序 锁 住 该 互 斥 元 ， 即 使 测试 运行 时 没有 出 错 ， 也 会 将 之 标记 成 一 
个 可 能 的 死 锁 。 

测试 多 线程 的 另 一 类 特殊 的 库 函 数 是 通过 多 个 线程 中 将 获得 锁 的 那个 线程 或 者 通 
过 notify one () 函数 调用 一 个 竞 态 变量 的 线程 的 控制 权 交 给 测试 人 员 来 实现 线程 的 
原子 属性 ， 如 互 斥 元 和 条 件 变量 。 这 样 可 以 让 你 建立 特定 的 测试 场景 并 且 验 证 代码 在 这 
些 特定 场景 内 是 否 能 顺利 运行 。 

此 外 , 在 C++ 标准 库 函 数 中 也 有 一 部 分 可 用 于 测试 的 库 函 数 ， 我 们 可 以 在 我 们 的 测 
试 工具 中 调用 这 些 标 准 库 函 数 。 

看 完 执 行 测试 代码 的 不 同方 式 之 后 ,现在 我 们 来 看 看 构建 测试 代码 来 实现 你 希望 的 
调度 顺序 的 方法 。 
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10.2.5 构建 多 线程 的 测试 代码 


前 面 的 10.2.2 WF, 我 告诉 大 家 你 要 找到 方式 来 为 你 测试 程序 的 “while” 部 分 提供 
某 种 可 行 的 调度 顺序 ， 下 面 我 们 将 要 学 习 在 这 一 过 程 会 遇 到 的 问题 。 

基本 的 问题 是 ， 你 需要 安排 一 组 线程 ， 这 组 线程 中 的 每 个 线程 在 你 指定 的 时 间 内 都 
可 以 执行 一 段 选 定 的 代码 。 最 常见 的 情况 是 ， 你 有 两 个 线程 ， 但 是 这 可 以 很 容易 地 扩展 
到 更 多 。 在 第 一 步 中 ， 你 需要 区 分 每 个 测试 的 不 同 的 部 分 。 

m 通用 的 启动 代码 需要 在 所 有 代码 之 前 启动 的 那 段 代码 。 

图 ”线程 特定 的 启动 代码 必须 在 每 个 线程 上 启动 的 那 段 代码 。 

E ”每 个 线程 的 实际 代码 是 指 你 希望 并 行 运行 的 那 段 代 码 。 

Wo ”在 并 行 执行 完成 后 运行 的 那 段 代码 ， 包 括 代 码 状 态 的 断言 。 

为 了 更 进一步 解释 ， 我们 来 看 看 10.2.2 节 的 测试 列表 执行 一 个 特定 的 例子 ， 一 个 线 
程 用 于 对 一 个 空 队 列 调用 push () ， 另 一 个 线程 则 用 于 调用 Pop () 。 

通用 启动 代码 很 简单 ,就 是 你 必须 创建 队列 。 执行 pop O 的 线程 没有 线程 特定 的 启 
动 代码 。 而 对 于 执行 push O 函数 的 线程 来 说 ， 它 的 线程 特定 的 启动 代码 依赖 于 队列 的 
接口 和 存储 对 象 的 类 型 。 如 果 将 要 存储 的 对 象 很 难 构建 或 者 必须 是 堆 分 配 的 ， 那 么 ， 你 
可 以 将 这 个 存储 对 象 的 构建 过 程 或 堆 分 配 过 程 作为 线程 特定 的 启动 代码 ,这样 存储 对 象 
的 构建 过 程 或 堆 分 配 过 程 就 不 会 影响 你 的 测试 了 。 相 反 ， 队 列 仅 存 储 普通 的 int 类 型 ， 
那 入 就 不 需要 在 启动 代码 中 构建 int 型 。 被 测试 的 实际 代码 是 相当 明确 的 一 一 就 是 对 
push () 和 pop O 的 调用 。 那 么 ， 在 这 个 例子 中 ， 哪 个 是 “结束 后 ”的 代码 部 分 呢 ? 

在 这 个 例子 中 , 那 段 “结束 后 ”的 代码 部 分 就 取决 于 你 希望 用 pop O 函数 来 做 什么 。 
如 果 你 用 它 来 阻塞 线程 直到 队列 有 数据 为 止 ， 那 么 ， 你 可 以 明确 “结束 后 ”代码 获取 向 
push () 函数 提供 的 返回 数值 和 队列 置 空 。 如 果 pop () 不 用 于 阻塞 线程 ， 并 且 在 队列 为 
空 时 结束 ,那么 你 需要 测试 两 种 可 能 性 ， 要 么 pop O 函数 返回 向 push () 函数 提供 的 数 
ig, 要 么 队列 为 空 或 者 pop O 函数 指示 没有 数据 并 且 队 列 中 有 一 个 元 素 。 当 其 中 的 任意 
一 种 可 能 性 为 真 时 , 你 希望 避免 的 是 场景 是 pop O 函数 显示 “没有 数据 ”而 且 队 列 是 空 
的 , 或 者 pop O 函数 返回 值 , 但 是 ， 队 列 却 仍然 不 为 空 。 为 了 简化 测试 , 假设 你 有 一 个 
阻塞 pop () 函数 。 那 么 最 后 的 代码 就 是 出 队列 的 数据 即 为 进 队列 的 数据 ,并且 队列 为 空 。 

至 此 , 我 们 已 经 区 分 了 代码 的 不 同 部 分 , 接着 你 就 要 尽量 让 一 切 代码 都 按 计划 运行 。 
一 个 可 行 的 办 法 是 使 用 一 系列 的 std: :promises 来 指示 一 切 就 绪 。 每 个 线程 设置 一 个 
promise 来 指示 该 线程 已 准备 就 绪 , 接着 等 待 从 第 三 方 std: :promise 获得 的 一 个 (或 
者 一 个 副本 ) std::shared future, 主线 程 等 待 所 有 线程 的 所 有 promise 被 设置 ， 
然后 控制 这 些 线程 运行 。 这 就 保证 了 在 并 行程 序 运行 之 前 每 个 线程 都 已 被 启动 ， 任 意 线 
程 特定 的 启动 代码 必须 在 线程 的 promise 设置 之 前 就 被 执行 。 最 后 ， 主 线程 要 等 待 所 有 
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线程 结束 并 检查 最 终 的 状态 。 你 同时 还 需要 注意 线程 异常 还 确保 不 会 有 任意 一 个 线程 需 
要 等 待 还 未 发 生 的 操作 信号 。 清 单 10.1 给 出 了 这 个 例子 的 测试 代码 。 


清单 10.1 队列 上 当前 调用 的 push() 和 pop() 的 测试 例子 


void test concurrent push and pop on empty queue() 


{ 


threadsafe_queue<int> q; <0 


std: :promise<void> go,push ready,pop ready; +O 
std::shared_future<void> ready (go.get_future()) ; -© 


std: :future<void> push done; 0 
std::future<int> pop done; 


try 


{ 
push done-std::async(std::launch::async, 
[&q, ready, &push ready] () 
{ 
push ready.set value(); 
ready.wait(); 
q.push(42) ; 
} 
i 
pop done-std::async (std: :launch: :async, 
[&q, ready, &pop ready] () 


pop ready.set value(); 
ready.wait(); 


return q.pop(); 0 
} 
) ' 


push ready.get future().wait(); 0 
pop ready.get future().wait(); 
go). seb, value); 


push done.get(); <D 
assert (pop done.get()--42); «D 
assert (q.empty()); 


) 


cateh.(. os) 


{ 
go.set value(); «-Qp 


throw; 


这 一 结构 很 好 地 呼应 了 我 们 前 面 的 介绍 。 首 先 ， 创 建 空 队 列 ， 这 部 分 作为 通用 启动 
代码 @。 然 后 ， 为 所 有 “就 绪 ” 信 号 创建 各 自 的 promise, Jf Ey go 信号 获取 一 个 
std::shared future 旨 。 接 下 来 ， 你 可 以 创建 future 来 表示 线程 已 经 运行 结束 O, 
这 些 需要 程序 跳 转 到 try 模块 之 外 , 这 样 你 就 可 以 为 异常 设置 go 信号 而 无 需 等 待 测试 
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线程 运行 结束 (因为 在 测试 代码 可 能 出 现 死 锁 一 将 死 锁 限制 在 测试 代码 内 部 是 一 种 相当 
理想 的 情况 )。 

dE try 模块 内 部 你 可 以 启动 线程 @、@ 一 一 你 可 以 使 用 std: :lanch: :async 来 
保证 任务 在 其 各 自 的 线程 上 运行 。 注 意 使 用 std::async 可 以 你 的 异常 安全 任务 相 比 
于 使 用 普通 的 std: :thread 来 说 更 为 简单 , 这 是 因为 future 的 析 构 函数 在 整个 线程 执 
行 过 程 中 都 会 加 入 该 线程 。Lambda 捕获 详细 说 明 每 个 任务 都 会 参考 队列 和 相关 的 
promise 已 就 绪 信 号 ， 并 且 将 从 go promise 中 复制 ready future, 

如 上 所 述 ， 每 个 任务 设置 它 自 己 的 ready 信号 ， 然 后， 在 运行 时 间 测试 代码 之 前 
等 待 通用 ready 信号 。 主 程序 的 过 程 与 之 相反 一 在 设置 信号 来 启动 真正 的 测试 @ 之 前 
等 待 来 自 两 个 线程 的 信号 @ 。 

( 最 终 , 主线 程 从 异步 调用 中 去 调用 future 上 的 get O 来 等 待 任务 的 完成 @、@@ 和 检查 结 
果 。 注 意 pop 任务 通过 future 来 返回 检索 值 @8， 因 此 ， 你 可 以 使 用 它 来 获取 断言 的 结果 @。 

如 果 抛 出 异常 ， 你 设置 go 信和 号 来 避免 任何 产生 悬挂 线程 的 和 再 次 抛 出 异常 的 机 会 @。 
任务 对 应 的 future® 在 后 面 声明 ， 那 么 ， 首 先 会 销毁 这 些 future 并 且 它 们 的 回收 器 会 在 
任务 未 就 绪 时 等 待 任务 完成 。 

虽然 这 似乎 是 相当 多 的 样板 只 是 为 了 测试 两 个 简单 的 调用 , 有 必要 使 用 一 些 类 似 的 
测试 以 实现 在 最 好 的 测试 时 机 测试 你 真正 想 要 的 部 分 。 例如， 实际 的 线程 启动 可 能 是 一 
个 非常 耗 时 的 过 程 ， 因 此 ， 如 果 你 不 让 线程 等 待 go 信号 ， 那 么 ，push 线程 就 会 在 pop 
线程 启动 之 前 就 已 经 完成 了 ， 这 样 就 完全 错过 了 测试 时 机 。 使 用 future 确保 两 个 线程 在 
相同 的 future 上 运行 和 阻塞 。 解 除 future 阻塞 允许 两 个 线程 同时 运行 。 一 旦 你 对 该 结构 
熟悉 后 ， 你 很 容易 就 可 以 在 该 模式 上 直接 创造 出 新 的 测试 代码 。 该 模式 也 可 以 很 容易 地 
扩展 到 多 个 线程 的 测试 。 

至 此 , 我 们 已 经 学 习 了 多 线程 代码 的 正确 性 。 尽 管 多 线程 代码 的 正确 性 是 一 个 很 重 
要 的 问题 , 但 它 不 是 你 进行 测试 的 唯一 理由 。 测 试 多 线程 代码 的 性 能 也 同样 重要 ， 这 部 
分 我 们 将 会 在 下 节 介 绍 。 


10.2.6 ”测试 多 线程 代码 的 性 能 


在 应 用 程序 中 使 用 并 行 的 一 个 主要 原因 是 为 了 充分 利用 现在 流行 的 多 核 处 理 器 来 
提高 应 用 程序 的 性 能 。 因 此 ， 实 际 测试 你 的 代码 确认 性 能 确实 得 到 提升 ， 就 像 你 对 应 用 
程序 尝试 了 其 他 性 能 优化 一 样 。 

使 用 并 行 提高 性 能 将 会 带 来 一 个 特殊 的 扩展 性 问题 一 一 你 可 能 希望 在 24 核 机 器 上 
代码 运行 速度 是 在 单 核 机 器 上 的 24 倍 , 24 个 核 是 平等 的 。 你 不 希望 代码 运行 在 24 KLE 
的 速度 仅仅 是 双核 机 器 上 的 两 倍 。 回 顾 8.4.2 小 节 ， 如 果 你 代码 中 重要 部 分 代码 仅 在 一 
个 线程 上 运行 ， 会 限制 代码 潜在 的 性 能 收益 。 因 此 ， 有 必要 在 你 开始 测试 前 查看 你 代码 
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的 整体 设计 ， 你 会 知道 你 是 否 能 够 获得 24 倍 的 性 能 提升 ， 或 者 你 代码 的 一 系列 整体 设 
计 和 架构 限制 你 的 代码 仅 能 获得 3 倍 的 性 能 。 

就 像 你 在 前 面 章节 所 看 到 的 ， 进 程 之 间 竞 争 访问 的 数据 会 极 大 地 影响 性 能 。 然 而 ， 
当 处 理 器 的 数目 少时 ,可 能 系统 性 能 较 好 ,而 当 处 理 器 数目 较 多 时 , 系统 性 能 反而 很 差 ， 
因为 处 理 器 的 数目 多 了 ， 竞 争 也 就 多 了 。 

因此 ， 当 测试 多 线程 代码 的 性 能 时 ， 最 好 先 检测 多 种 不 同 配置 下 的 系统 性 能 ， 
由 此 你 能 评估 出 系统 性 能 扩展 能 力 。 至 少 ， 你 该 测试 下 单 处 理 器 系统 和 多 处 理 器 系 
统 下 的 性 能 。 


10.3 总 结 


在 本 章 ， 我 们 学 习 了 各 种 你 可 能 会 碰 到 的 与 并 行 相关 的 错误 类 型 ， 如 死 锁 活 锁 、 数 
据 竞 争 和 其 他 问题 的 竞争 条 件 等 。 接 着 ,我 们 又 介绍 了 定位 这 些 错 误 的 一 些 技巧 。 这 些 
技巧 包括 ; 代码 检阅 过 程 中 不 断 地 自我 提问 及 思考 解答 、 指 导 扎 写 测试 代码 ， 以 及 如 何 
为 并 行 代码 构建 测试 代码 。 最 后 ， 我 们 学 习 了 一 些 有 助 于 测试 的 通用 部 件 。 


M 


C++ 新 标准 增加 的 并 不 只 是 对 并 发 的 支持 ， 除 此 之 外 还 有 一 整套 的 语言 特性 以 及 
新 的 类 库 。 在 这 一 附录 中 ， 我 会 对 一 些 CH+11 新 语言 特性 进行 一 番 概述 ， 这 些 特性 有 
助 于 我 们 理解 Thread 库 以 及 本 书 的 其 他 内 容 。 它 们 之 中 除了 thread local (参见 
A.8 节 ) 外 ， 与 并 发 都 没有 直接 的 联系 ， 但 在 进行 多 线程 编程 的 时 候 却 很 实用 。 这 里 
涉及 的 内 容 ,， 都 是 对 简化 代码 或 提高 代码 可 读 性 所 必需 (如 右 值 引用 ) 或 者 很 重要 的 。 
使 用 了 这 些 特性 的 代码 或 许 刚 开始 会 因为 不 为 大 家 所 熟知 ， 而 显得 很 难 懂 ， 但 当 你 熟 
悉 它们 之 后 ， 结 果 就 会 反 过 来 。 随 着 C++11 逐渐 流行 开 来 ， 利 用 这 些 特 性 的 代码 就 会 
变 得 稀 松 平常 。 

话 不 多 说 ， 让 我 们 首先 来 看 看 右 值 引用 (rvalue references), TREER, XTE 
好 地 在 对 象 间 进行 线程 、 锁 或 者 其 他 任何 东西 的 所 有 权 转 换 ， 右 值 引用 被 广泛 地 使 用 。 


右 值 引用 


如 果 你 曾 做 过 C++ 编程 ， 就 会 对 引用 很 熟悉 。C++ 的 引用 允许 我 们 为 一 个 现 有 的 对 
象 创建 一 个 新 的 名 字 ， 所 有 通过 引用 完成 的 访问 和 修改 操作 都 会 影响 其 本 体 。 例 如 ， 
int var=42; 创建 一 个 到 变量 的 
int& ref-var; 引用 a 因为 对 引用 进行 赋值 ， 
ref-99; 本 体 也 被 修改 了 


assert (var==99) ; 
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迄今 为 止 我 们 所 使 用 的 引用 都 是 左 值 引 用 〈lvalue references)。 左 值 (lvalue) 这 一 
术语 来 源 于 C 语言 ,用 来 指 代 那 些 可 以 用 在 赋值 表达 式 左 侧 的 东西 ， 具 名 对 象 、 在 栈 和 
堆 上 分 配 的 对 象 ， 或 者 其 他 对 象 的 成 员 ， 总 之 就 是 有 确定 存储 空间 的 东西 。 而 术语 右 值 
(rvalue) 也 是 源 自 C 语言 ， 指 的 是 只 能 在 赋值 表达 式 右 侧 出 现 的 东西 ， 如 字面 值 和 临 
时 对 象 。 左 值 引用 只 能 被 绑 定 到 左 值 ， 不 能 绑 定 到 右 值 。 例 如 ， 你 不 能 这 样 写 ， 


int& i-42; «— 不 能 编译 


因为 42 是 一 个 右 值 。 好 吧 ， 这 不 是 太 准确 ， 你 一 直 能 够 将 一 个 右 值 绑 定 到 const 
左 值 引用 上 : 


int const& i=42; 


但 是 ， 在 右 值 引用 之 前 ， 为 了 能 够 将 临时 对 象 作为 引用 参数 传递 给 函数 ，C++ 标 准 
故意 设置 了 一 个 例外 。 人 允许 进行 隐 式 转换 ， 所 以 你 可 以 这 样 写 . 


void print(std::string const& s); 创建 临时 的 std::string 
print ("hello"); 对 象 


无 论 如 何 ，C++11 标准 引入 了 只 能 绑 定 到 右 值 ， 而 不 能 绑 定 到 左 值 的 右 值 引用 
Crvalue references)， 在 声明 的 时 候 从 使 用 一 个 & 符 号 改 为 使 用 两 个 & 符 号 ， 
tates 1242; 不 能 编译 
ae meme 

于 是 , 你 可 以 通过 函数 重 载 , 让 一 个 重 载 版 本 接受 左 值 引用 , 另 一 个 接受 右 值 引用 ， 
来 决定 函数 的 形 参 是 左 值 还 是 右 值 ， 这 就 是 移动 语义 (move semantics) 的 基础 。 


A.1.1 移动 语义 


右 值 通常 是 临时 对 象 ， 因 此 可 以 被 自由 地 修改 。 如 果 已 知 函 数 的 形 参 是 一 个 右 值 ， 
那么 就 可 以 将 它 用 作 临 时 存储 ,或 者 “窃取 ”其 内 容 而 不 影响 程序 的 正确 性 。 这 就 意味 
着 ,你 可 以 移动 (move) 右 值 参数 的 内 容 ， 而 不 是 复制 (copy) 其 内 容 。 对 于 大 型 的 动 
态 结构 ， 这 样 做 可 以 节约 大 量 的 内 存 开支 ， 并 且 能 够 提供 很 大 的 优化 空间 。 考 虑 一 个 函 
数 ， 它 接受 一 个 std: :vector<int> 类 型 的 形 参 ， 并 且 在 内 部 复制 一 份 以 便于 在 不 影 
响 原 数据 的 情况 下 进行 修改 。 以 往 的 做 法 是 ， 将 这 个 参数 作为 一 个 常量 左 值 引用 ， 并 且 
在 内 部 进行 复制 。 
void process copy(std::vector«int» const& vec ) 


Std::vector«int». vec (vec) 
vec.push_back (42); 


这 就 允许 函数 同时 接受 左 值 和 右 值 ， 但 每 次 都 被 迫 进行 一 次 复制 。 如 果 你 用 一 个 接 
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受 右 值 引用 的 版 本 重 载 该 函数 ， 你 就 可 以 避免 在 右 值 的 情况 下 做 复制 ， 因 为 你 明白 可 以 
自由 地 修改 原始 值 ， 


void process copy (std: :Vector<int> && vec) 


vec.push back (42); 


) 

现在 ， 如 果 该 函数 是 类 的 构造 函数 ， 你 就 可 以 窃取 右 值 的 内 容 ， 并 且 在 新 实例 中 使 
用 它们 。 考 虑 清单 A.1 列 出 的 类 ， 在 默认 构造 函数 中 分 配 了 一 大 块 内 存 ， 它 会 在 析 构 函 
数 中 被 释放 。 


清单 A.1 具有 移动 构造 函数 的 类 


class X 
{ 
private: 
int* data; 
public: 
XQ) 
data(new int [1000000] ) 
{} 
-X() 
{ 


delete [] data; 


X(const X& other): 
data(new int[1000000]) 
{ 


std: :copy (other.data,other.data«1000000,data); 
X(X&& other): 


data (other .data) 
{ 


) 


other.data=nullptr; 


va 

拷贝 构造 函数 copy constructor) @ 正 是 按照 你 所 期 望 的 那样 定义 的 ， 分 配 一 个 新 
的 内 存 块 ， 然 后 将 数据 复制 进去 。 然 而 ， 你 还 可 以 编写 一 个 通过 右 值 引用 接受 原 值 的 构 
RM @， 这 就 是 移动 构造 函数 (move constructor)。 在 这 个 例子 里 , 仅仅 是 把 数据 的 
指针 复制 一 份 ， 然 后 赋 以 other 实例 一 个 空 指针 ， 这 样 就 可 以 节约 大 量 的 内 存 空间 和 
从 右 值 创 建 变量 的 时 间 。 

对 于 类 X 而 言 , 移动 构造 函数 仅仅 是 一 项 优化 , 但 在 有 些 场 合 ， 即 便当 提供 一 个 找 
贝 构造 函数 是 毫 无 意义 的 时 候 , 移动 构造 函数 也 有 其 意义 ,例如 , std: :unique_ptr<> 
的 全 部 意义 就 在 于 每 个 非 空 实例 都 是 指向 其 对 象 的 唯一 指针 ,因此 拷贝 构造 函数 是 没有 
意义 的 。 然 而 ， 移 动 构造 函数 允许 在 实例 间 传 送 指针 的 所 有 权 ， 并 且 多 许 
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std: :unique_ptr<> 被 用 作 函 数 的 返回 值 一 一 指针 被 移动 而 不 是 被 复制 了 。 
如 果 你 希望 显 式 地 从 一 个 你 确信 不 会 再 使 用 的 命名 对 和 象 中 移动 数据 ,你 可 以 通过 使 
用 static cast<X&&> 或 者 调用 std: :move () 来 将 其 转换 为 右 值 ; 


X Xl; 
X x2=std: :move (x1) ; 
X x3=static_cast<X&&>(x2) ; 


当 你 希望 将 参数 值 移 人 局 部 变量 或 成 员 变量 的 时 候 ， 就 可 以 从 中 获 益 ， 因 为 一 个 右 
值 引用 参数 虽然 可 以 绑 定 到 右 值 ， 但 在 函数 内 部 ， 却 是 被 视 为 左 值 的 ， 


void do_stuff (X&& x ) 


X a(x ); < 复制 
(std: :move (x )) ; < 复制 
X blstd: :move (x_ 正确 , 右 值 绑 定 到 右 
san (x0); 错误 ， 左 值 不 能 绑 定 到 值 引 用 
do stuff(x); 右 值 引用 


移动 语义 在 Thread 类 库 中 被 广泛 使 用 ， 既 可 以 用 在 对 于 复制 没有 语义 上 的 意义 但 
资源 可 以 被 转移 的 地 方 ， 也 可 以 作为 一 项 优化 ， 以 避免 反正 会 被 销毁 掉 的 源 所 带 来 的 复 
制 开销 。 在 22 节 的 一 个 例子 中 ， 你 曾 看 到 我 们 用 std: :move () 将 一 个 std:: 
unique_ptr<> 实 例 传送 到 一 个 新 建 的 线程 中 ， 然 后 在 2.3 节 中 ， 我 们 又 看 到 了 在 
std: : thread 实例 间 传 送 线程 的 所 有 权 。 

Std::thread, std: :unique_lock<>, std::future<>, std::promise«» 
fll std: :packaged task<> 都 是 不 可 复制 的 , 但 它们 都 具有 移动 构造 函数 ， 允许 相关 
资源 在 实例 间 进 行 传输 ， 并 且 支 持 它们 作为 函数 的 返回 值 。std: :string 和 
std: :Vector<> 可 以 被 复制 ， 但 它们 同样 具有 移动 构造 函数 和 移动 赋值 操作 符 ， 以 此 
来 避免 大 量 数据 作为 右 值 时 的 复制 开销 。 

C++ 标准 库 并 不 会 对 显 式 移 人 另 一 个 对 象 的 对 象 做 任何 处 理 ， 除 了 销毁 和 对 其 赋值 
(复制 或 者 移动 ， 后 者 更 常见 ) 之 外 。 然 而 ， 确 保 一 个 处 于 移 人 状态 的 类 的 不 变性 ， 是 
好 的 习惯 。 例 如 ， 一 个 用 作 移 动 来 源 的 std: :thread 实例 等 效 于 一 个 默认 构造 的 
std::thread 实例 ， 一 个 用 作 移 动 来 源 的 std::string 实例 仍然 具备 有 效 状 态 ， 尽 
管 无 法 保证 究竟 那个 状态 是 什么 〈 即 不 知道 该 字符 串 有 多 长 或 者 包含 什么 字符 ) 。 


A.1.2 右 值 引用 与 函数 模板 


使 用 右 值 引 用 作为 函数 模板 的 参数 的 最 终 差 别 在 于 如 果 函 数 形 参 是 对 模板 参数 的 
右 值 引用 ， 如果 提供 了 一 个 左 值 ， 自 动 模板 参数 类 型 推断 会 将 类 型 推断 为 左 值 引用 ， 如 
果 提 供 的 是 右 值 ， 则 推断 为 普通 的 无 修饰 类 型 。 这 听 起 来 有 些 绕 口 ， 所 以 我 们 来 看 一 个 
示例 。 考 虑 下 面 的 这 个 函数 : 
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template<typename T> 
void foo(T&& t) 


{} 
如 果 按 照 如 下 所 示 用 一 个 右 值 进 行 调用 ， 那 么 T 就 会 推断 为 该 值 的 类 型 ， 


foo (42) ; «— Wii foo<int>(42) 调用 foo<double>(3.14159) 
foo(3.14159) ; i 
foo(std::string()); «a— 调用 foo<std::string>(std::string()) 

然而 ， 如 果 你 用 一 个 左 值 来 调用 foo, T 就 会 被 推断 为 一 个 左 值 引用 : 
iat fo Hewat 


因为 函数 参数 声明 为 T&&， 也 就 是 一 个 引用 的 引用 ， 它 被 视 为 原始 的 引用 类 型 。 于 
是 foocint&» 0 的 签名 就 是 : 


void foo«int&»(int& t); 


这 就 允许 单个 函数 模板 同时 接受 左 值 和 右 值 参数 , 并 且 被 用 作 std: : thread 的 构 
造 函数 (参见 2.1 节 和 2.2 节 ) ， 以 便于 当 参 数 是 右 值 的 时 候 ， 受 支持 的 可 调用 对 象 能 够 
被 移动 到 内 部 存储 中 ， 而 非 复制 。 


有 时 候 , 允许 一 个 函数 被 复制 是 没有 意义 的 。std:mutex 就 是 个 典型 的 例子 一 一 如 
果 你 真 的 对 互 斥 元 进行 复制 这 意味 着 什么 ? std: :unique_lock<> 是 另 一 个 例子 ， 某 
个 实例 是 其 所 持 有 锁 的 唯一 拥有 者 。 如 果真 的 对 其 进行 复制 ， 就 意味 着 那个 副本 也 控制 
该 锁 ， 这 是 没有 意义 的 。 在 实例 间 转移 所 有 权 ， 正 如 A.1.2 节 中 提 到 的 ， 是 有 意义 的 ， 
但 那 并 不 是 复制 。 我 可 以 肯定 你 还 遇 到 过 其 他 的 例子 。 

过 去 阻止 一 个 类 被 复制 的 惯常 方法 是 将 拷贝 构造 函数 和 拷贝 赋值 操作 符 声明 为 私 
有 的 ， 并 且 不 提供 其 实现 。 如 果 有 任何 类 外 部 的 代码 试图 复制 一 个 实例 ， 将 会 导致 一 个 
编译 时 错误 ， 如 果 任何 类 成 员 函 数 或 者 友 元 试图 复制 一 个 实例 ， 则 会 导致 一 个 连接 时 错 
误 (缺少 实现 所 导致 ) : 


class no copies 

{ 

public: 
no_copies() {} 

private: 
no copies(no copies const&) ; Lu 没有 实现 
no copies& operator= (no copies const&) ; 

ht 

no copies a; 2 不 会 编译 


no copies b(a); 
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在 CH1 中 ， 委 员 会 认识 到 这 虽然 是 惯常 做 法 ， 但 同时 也 认识 到 这 有 一 些 不 优雅 。 
于 是 ， 委 员 会 提供 了 一 个 更 加 通用 的 机 制 ， 你 还 可 以 将 其 应 用 到 其 他 场合 ， 你 可 以 通过 
在 函数 声明 前 添加 =deleted, 将 一 个 函数 声明 为 已 删除 的 (deleted)。 于 是 no copies 
可 以 写 为 : 


class no copies 


{ 


public: 
no_copies() {} 
no_copies(no_copies const&) = delete; 
no_copies& operator=(no_copies const&) = delete; 


tub 

这 就 比 原来 的 代码 更 加 具有 描述 性 ， 并 且 清 楚 地 表达 了 意图 。 这 也 允许 编译 器 给 出 
更 具 描 述 性 的 错误 信息 , 并 且 将 你 在 类 的 成 员 函 数 内 执行 拷贝 的 错误 从 连接 时 转移 到 了 
编译 时 。 | 

如 果 在 删除 了 拷贝 构造 函数 和 拷贝 赋值 操作 符 的 同时 , 显 式 编写 了 移动 构造 函数 和 
移动 赋值 操作 符 ， 该 类 就 变 成 只 能 移动 的 ， 就 像 std::thread 和 std::unique_ 
lock<> 一 样 。 清 单 A.2 展示 了 这 种 只 移动 类 型 的 实例 。 


清单 A.2 简单 的 只 移动 类 型 


class move only 
{ 

std::unique ptr«my class» data; 
public: 

move only(const move only&) = delete; 

move only(move only&& other): 

data (std: :move (other.data)) 
{} 


move_only& operator=(const move_only&) = delete; 
move_only& operator=(move_only&& other) 
{ 
data=std: :move (other.data) ; 
return. *this; 
} 
}; 


uova only mi; 错误 ， 拷贝 构造 函数 声 en 
move only m2 (m1); 明 为 被 删除 的 du t SR 
move only m3 (std: :move (m1)) ; 函数 


只 移动 对 象 可 以 作为 函数 参数 传人 ， 也 可 以 从 函数 中 返回 。 但 如 果 你 希望 从 一 个 左 
值 移 人 ， 你 必须 总 是 显 式 地 使 用 std: :move () 或 者 static cast<T&&>。 

你 可 以 将 =delete 标识 符 应 用 到 任意 函数 ， 而 不 仅仅 是 拷贝 构造 函数 和 拷贝 赋值 
操作 符 。 这 可 以 清楚 地 表示 该 函数 是 不 可 用 的 ， 但 并 不 仅 限于 此 。 一 个 被 删除 的 函数 按 
昭通 常 的 方式 参与 重 载 方案 ， 并且 当 它 被 选中 时 仅 导 致 一 个 编译 时 错误 ， 这 可 以 用 来 移 
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除 特定 的 重 载 。 例 如 ， 如 果 你 的 函数 接受 一 个 short 类 型 参数 ， 你 可 以 通过 编写 一 个 
接受 int 类 型 变量 的 重 载 版 本 并 将 其 声明 为 被 删除 的 ， 来 阻止 截断 int 型 值 ; 


void foo(short); 
void foo(int) = delete; 


但 凡 尝试 用 int 来 调用 foo， 现 在 都 会 遇 到 编译 错误 ， 调 用 者 必须 显 式 地 将 值 转 
换 为 short: 


foo (42) ; 
foo( (short)42) ; a— 正确 PCR 重 载 声明 为 被 
defaulted 函数 


删除 的 函数 允许 你 显 式 声 明 一 个 函数 未 被 实现 ， 而 默认 的 〈defaulted) 函数 则 恰恰 
相反 ， 它 们 允许 你 告诉 编译 器 必须 为 你 编写 这 个 函数 ， 作 为 其 “默认 ”实现 。 当 然 ， 你 
只 能 对 编译 器 可 以 自动 生成 的 函数 这 样 做 ， 包 括 默认 构造 函数 、 析 构 函 数 、 拷 贝 构造 函 
数 、 移 动 构造 函数 、 拷 贝 赋值 操作 符 和 移动 赋值 操作 符 。 
那 你 为 什么 会 要 这 么 做 呢 ? 以 下 是 一 些 可 能 的 原因 。 
m ”为 了 改变 函数 的 可 访问 性 。 在 默认 情况 下 ， 编 译 器 生成 的 函数 是 Pubplic 的 。 
如 果 你 希望 将 它们 变 为 protected 或 者 Private， 你 就 得 亲自 去 编写 它们 ， 
通过 将 它们 声明 为 defaulted， 你 就 可 以 让 编译 器 去 编写 这 些 函 数 ， 同 时 又 改变 
它们 的 访问 级 别 。 
四 “作为 注解 。 即 使 编译 器 生成 的 版 本 足够 使 用 ， 仍然 值得 像 这 样 将 其 显 式 进行 声 
明 ， 以 便于 你 或 者 其 他 人 将 来 再 看 代码 的 时 候 能 够 清楚 地 了 解 这 是 有 意 为 之 。 
加 ”为 了 强制 编译 器 去 生成 该 函数 ， 否 则 它们 可 能 不 会 这 么 做 。 典 型 的 是 针对 默认 
构造 函数 ， 只 有 在 没有 用 户 自 定义 构造 函数 的 时 候 它 才 通常 会 由 编译 器 生成 。 
如 果 你 需要 自 定 义 一 个 拷贝 构造 函数 ( 举 个 例子 )， 你 仍然 可 以 通过 声明 一 个 
defaulted 的 默认 构造 函数 ， 而 让 编译 器 生成 它 。 
加 ”为 了 将 一 个 析 构 函数 设 为 虚拟 的 ， 将 其 留 给 编译 器 来 生成 。 
图 ”强制 声明 一 个 特定 的 拷贝 构造 函数 , 如 令 其 接受 一 个 非 const 引用 的 源 参数 而 
不 是 一 个 const 引用 。 
男 “ 利 用 编译 器 生成 函数 的 一 些 特定 属性 ， 如 果 你 自己 提供 实现 的 话 ， 可 能 会 失去 
它们 一 一 这 一 点 我 们 稍 后 会 提 及 。 
类 似 于 deleted 函数 通过 后 缀 =delete 来 进行 声明 ，defaulted 函数 只 需要 在 声明 后 
添加 =default 来 进行 声明 ， 如 : 


class Y 


{ 
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ivate: ^ 

SEDE, - default; ead 改变 访问 级 别 
public: 接受 一 个 非常 量 声明 为 defaulted 作 

Y(Y&) = default; 引用 

T& operator-(const Y&) = default; acies 
oes. 改变 访问 级 别 并 且 

virtual ~Y() = default; 添加 virtual 


}; 
我 之 前 提 到 过 编译 器 生成 的 函数 可 以 具有 一 些 特 殊 的 属性 , 而 在 用 户 定义 的 版 本 中 
却 无 法 获得 。 其 中 最 大 的 区 别 就 是 编译 器 生成 的 函数 可 以 是 平凡 的 (trivial)。 这 会 带 来 
包括 下 面 所 述 的 一 些 后 果 。 
图 ”具备 平凡 的 拷贝 构造 函数 、 平 凡 的 拷贝 赋值 操作 符 和 平凡 的 析 构 函数 的 对 和 象 可 
以 被 memcpy 和 memmove 复制 。 

图 ”constexpr 函数 (参见 A.4 $) 所 使 用 的 字面 值 类 型 必须 具有 一 个 平凡 的 构造 函 
数 、 找 贝 构造 函数 和 析 构 通 数 。 

图 ”拥有 平凡 的 默认 构造 函数 、 找 贝 构造 函数 、 拷 贝 贼 值 操作 符 和 析 构 函数 的 类 可 
以 用 在 一 个 具有 用 户 定义 构造 函数 和 析 构 函数 的 联合 体 中 ，。 

图 ”具有 平凡 的 拷贝 赋值 操作 符 的 类 可 以 在 std: :atomic<> 类 模板 (参见 5.2.6 
节 ) 中 使 用 ， 用 来 提供 该 类 型 值 的 原子 操作 。 

仅 将 函数 声明 为 =default 并 不 能 使 其 成 为 平凡 的 (只 有 在 类 同时 支持 所 有 其 他 条 
件 的 时 候 ， 相 应 的 函数 才能 成 为 平凡 的 )， 但 如 果 在 用 户 代 码 中 显 式 地 编写 该 函数 ， 则 
会 阻止 其 成 为 平凡 的 。 

具有 编译 器 生成 函数 和 用 户 提供 的 等 效 函 数 的 类 之 间 的 第 二 个 不 同 ， 就 是 没有 用 户 
提供 的 构造 函数 的 类 可 以 作为 聚合 体 〈aggregate)， 并 且 可 以 通过 一 个 聚合 初始 化 器 进 
行 初始 化 ; 


struct aggregate 


aggregate() = default; 

aggregate (aggregate const&) = default; 
int a; 

double b; 


cie ri x={42,3.141}; 

在 这 里 ，x.a 被 初始 化 为 422，x.b 被 初始 化 为 3.141。 

编译 器 生成 的 函数 和 用 户 提供 的 等 效 函数 之 间 的 第 三 点 区 别 非 常 深 奥 ， 仅仅 适用 于 
默认 构造 函数 ， 而 且 仅 仅 是 那些 满足 特定 条 件 的 类 的 默认 构造 函数 。 考 虑 下 面 这 个 类 ; 
struct X 


{ 
13 


int a; 
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如 果 你 不 使 用 初始 化 器 创建 类 X 的 实例 ,那么 其 中 的 int (a) 会 被 默认 构造 (default 
initialized )。 如 果 该 对 象 拥有 静态 存储 期 ， 那 么 它 会 被 初始 化 为 零 ; 否则 ， 它 会 拥有 一 
个 不 确定 的 值 ， 如 果 在 其 未 被 赋予 新 值 之 前 访问 它 ， 可 能 会 导致 未 定义 的 行为 : 

X x1; a xla 具有 不 确定 的 值 


另 一 方面 , 如 果 你 通过 显 式 地 调用 默认 构造 函数 来 初始 化 X 的 实例 , 那么 a 会 被 初 
始 化 为 零 : 
X x2=X(); a x2a 一 0 

这 种 怪异 的 特性 同样 延伸 至 基 类 和 成 员 。 如 果 你 的 类 拥有 编译 器 生成 的 默认 构造 函 
数 ， 并 且 所 有 数据 成 员 和 基 类 同样 拥有 编译 器 生成 的 默认 构造 函数 ， 则 那些 基 类 和 内 置 
类 型 成 员 的 数据 成 员 也 会 如 此 ， 或 是 留 下 一 个 不 确定 的 值 ， 或 是 初始 化 为 零 ， 这 取决 于 
外 部 的 类 的 默认 构造 函数 是 否 被 显 式 调 用 。 

尽管 这 条 规则 很 混乱 并 且 容 易 导 致 错误 ， 但 它 却 有 其 作用 ， 并 且 如 果 你 自己 编写 默 
认 构 造 函 数 ， 你 会 失去 这 条 特性 。 像 a 这 样 的 数据 成 员 总 是 被 初始 化 〈 因 为 你 指定 了 一 
个 值 或 者 显 式 默 认 构 造 函 数 ) 或 者 总 是 未 被 初始 化 〈 因 为 你 没有 这 人 么 做 ) : 


X::X():a() () 4— | =() 
X::X() 1a (42) () wats 4) 总 是 a 一 42 
X::X() () 0 


如 果 你 像 第 三 个 例子 @ 中 那样 , 从 X 的 构造 函数 中 省 略 a 的 初始 化 , 那么 对 于 X 的 
非 静态 实例 ，a 未 被 初始 化 ， 对 于 具有 静态 存储 期 的 Xx，a 被 初始 化 为 零 。 

在 通常 情况 下 ， 如 果 你 手动 编写 任何 其 他 的 构造 函数 ， 编 译 器 就 不 再 为 你 生成 默认 
构造 函数 ， 所 以 如 果 你 需要 的 话 ， 就 得 自己 去 编写 它 ， 这 意味 着 你 将 失去 这 一 奇异 的 初 
始 化 特性 。 然 而 ， 通 过 显 式 地 将 该 构造 函数 声明 为 defaulted， 可 以 令 编译 器 强制 地 为 你 
生成 默认 构造 函数 ， 这 一 特性 也 会 保留 下 来 : 


X::X() = default; «— 为 a 应 用 默认 初始 化 规则 


这 一 特性 被 用 于 原子 类 型 (参见 5.2 节 ), 它们 的 构造 函数 就 显 式 地 为 defaulted。 它 
们 的 初始 值 总 是 未 定义 的 ， 除 非 (a) 它 们 具有 静态 存储 时 间 段 〈 因 此 被 静态 地 初始 化 为 
32), ，(b) 显 式 地 调用 默认 构造 函数 ， 请 求 零 初始 化 ，(e) 显 式 地 指定 一 个 值 。 注 意 在 原子 
类 型 的 情况 下 ， 用 一 个 值 进行 初始 化 的 构造 函数 被 声明 为 constexpr (参见 A.4 节 )， 
以 便 允 许 静 态 初始 化 。 


AA constexpr 函数 


4 42 这 样 的 整 型 字面 值 是 常量 表达 式 C constant expressions), 简单 的 算术 表达 式 ， 
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如 23x2-4， 也 是 如 此 。 你 甚至 可 以 使 用 整数 类 型 的 consc 变量 ， 它 们 又 是 通过 由 常 
量 表达 式 组 成 的 新 的 常量 表达 式 来 进行 初始 化 的 : 


const int i=23; 

const int two i-i*2; 

const int four=4; 

const int forty two-two i-four; 


除了 使 用 常量 表达 式 来 创建 能 用 于 其 他 常量 表达 式 的 变量 , 还 有 些 事情 你 只 能 通过 
常量 表达 式 来 完成 。 

图 ”指定 数组 的 边界 : 
Lat, blandis 99] 错误 , bounds 不 是 一 个 党 


int array [bounds]; 量 表达 式 正确 ， bounds2 是 
const int bounds2=99; 一 个 常量 表达 式 


int array2 [bounds2] ; 


Wo ”指定 非 类 型 模板 参数 的 值 : 


template<unsigned size> 


struct test 错误 bounds 
{}; 不 是 一 个 常量 
test<bounds> ia; 表达 式 正确 ，bounds2 是 一 
test«bounds2» ia2; 个 常量 表达 式 
E 在 类 定义 中 ， 为 一 个 static const 的 整数 类 型 类 数据 成 员 提 供 一 个 初始 


化 器 : 


class X 


{ 
ht 


Static const int the answer-forty two; 


图 ”为 内 置 类 型 或 者 集合 提供 一 个 初始 化 器 ， 它 可 被 用 于 静态 初始 化 : 
struct my_aggregate 

int a; 
ERN, 静态 初始 化 
Static my aggregate mal-(forty two,123); S 
int dummy=257; ds 动态 初始 化 
Static my aggregate ma2={dummy, dummy}; 

WO 像 这 样 的 静态 初始 化 可 以 用 来 避免 初始 化 顺序 的 问题 以 及 竞争 条 件 。 

上 述 的 这 些 都 不 是 新 生 事物 ， 在 1998 版 本 的 C++ 标准 中 你 都 可 以 做 到 。 然 而 ,在 
新 标准 中 ,通过 引入 constexpr 关键 字 ， 常 量 表达 式 〈constant expression) 的 构成 被 
扩展 了 。 

constexpr 关键 字 主 要 作为 函数 修饰 符 。 如 果 函 数 的 参数 和 返回 值 满足 特定 的 要 
求 ， 并 且 函 数 体 足 够 简洁 ， 该 函数 就 可 以 声明 为 constexpr， 这 样 它 就 可 以 在 常量 表 


A.4.1 
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达 式 中 被 使 用 ， 比 如 ; 


constexpr int square(int x) 


( 


return x*x; 


int array[square(5)]; 

在 这 里 ，array 会 拥有 25 条 记录 ， 因 为 square 被 声明 为 constexpr。 当 然 ， 
仅仅 因为 该 函数 可 以 被 用 于 常量 表达 式 并 不 意味 着 它 的 所 有 用 法 都 自动 地 成 为 常量 表 
达 式 。 
int dummy=4; 错误 , dummy 不 是 一 个 
int array [square (dummy)]; 常量 表达 式 

在 这 个 例子 中 , dummy 不 是 一 个 常量 表达 式 O, 所 以 square (dummy) 也 不 是 〈 仅 
是 一 个 常规 的 函数 调用 ) ， 因 此 也 不 可 被 用 来 指定 array 的 边界 。 


constexpr 与 用 户 定 义 类 型 


到 目前 为 止 , 所 有 的 示例 都 是 用 的 内 置 类 型 比如 int。 然 而 , 新 C++ 标准 允许 常量 
表达 式 可 以 是 任何 满足 字面 值 类 型 要 求 的 类 型 。 如 果 要 一 个 类 型 具有 字面 值 类 型 资质 ， 
以 下 几 点 必须 全 部 满足 。 

图 ”必须 具备 平凡 的 拷贝 构造 函数 。 

m ”必须 具 备 平凡 的 析 构 函数 。 

m ”所 有 非 静态 数据 成 员 和 基 类 必须 是 平凡 的 类 型 ， 

加 ”必须 具有 一 个 平凡 的 默认 构造 函数 或 者 constexpr 构造 函数 ， 而 非 找 贝 构造 

hy HK, 

我 们 将 马上 看 一 看 constexpr 构造 函数 。 现 在 ， 我 们 关注 一 下 具有 平凡 的 默认 构 
造 函 数 的 类 ， 比 如 下 面 列 出 的 CX 类 。 


清单 A.3 ”具有 平凡 默认 构造 函数 的 类 

class CX 
private: 

int a; 

int’ b? 
public: 

CX() = default; 0 

CX(int-a., int b): +O 

a(a_),b(b_) 


{} 


int get_a() const 


{ 
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return ay 


int get_b() const 


{ 


return, b; 


int foo() const 


{ 


return a+b; 


注意 , 我 们 显 式 地 将 默认 构造 函数 @ 声明 为 defaulted (参见 A.3 35), 这 是 为 了 在 
面 对 用 户 定义 构造 函数 @ 的 时 候 保持 它 的 平凡 性 质 。 因 此 该 类 型 满足 作为 字面 值 类 型 
的 全 部 条 件 ， 你 就 可 以 将 其 用 在 常量 表达 式 中 ， 比 如 ， 提 供 一 个 constexpr 函数 来 创 
建新 的 实例 : 


constexpr CX create cx() 


return CX(); 


) 
你 还 可 以 创建 一 个 简单 的 constexpr 函数 来 复制 其 参数 ， 


constexpr CX clone(CX val) 


return val; 


) 
不 过 这 差不多 就 是 所 有 你 可 以 做 的 事情 了 一 一 一 个 constexpr 函数 仅 能 调用 其 他 的 
constexpr 函数 。 所 以 你 能 够 做 的 , 就 是 将 constexpr 应 用 至 CX 的 成 员 函 数 和 构造 函数 ， 


class CX 
{ 
private: 
int a; 
int b; 
public: 
CX() s' default; 
constexpr COX(int- à iy int bi)’: 
a(a ),b(b ) 
{} 


constexpr int get_a() const +@ 


return a; 


} 


constexpr int get_b() +O 
{ 


return b; 


} 


constexpr int foo() 
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return a+b; 
) 
yo 
注意 ，get a 0 @ 后 的 const 限定 符 现在 是 多 余 的 ， 因 为 使 用 constexpr 已 经 
暗示 这 一 点 了 。 即 便 省 略 了 const 限定 符 ，get_b () 仍然 是 const 的 。 现 在 可 以 定义 
如 下 所 示 的 更 加 复杂 的 constexpr 函数 。 
constexpr CX make cx(int a) 


return CX(a,1); 


) 


constexpr CX half double(CX old) 


{ 
p 


constexpr int foo squared(CX val) 


return CX(old.get a()/2,01d.get b()*2); 


return square (val.foo()); 


) 


int array[foo squared(half double (make cx(10)))]; 


然而 有 趣 的 是 , 如 果 你 所 需要 的 仅仅 是 一 个 更 加 优雅 的 计算 数组 界限 的 方式 或 者 一 
个 完整 的 常数 ， 这 样 做 会 花费 大 量 的 精力 。 引 入 用 户 定义 类 型 的 常量 表达 式 和 
constexpr 函数 的 主要 优点 ， 就 是 由 常量 表达 式 初始 化 的 字面 值 类 型 对 象 会 被 静态 初 
始 化 ， 于 是 它们 的 初始 化 就 避免 了 竞争 条 件 和 初始 化 顺序 问题 。 


CX si=half double (CX(42,19)); «— 静态 初始 化 


这 同样 包括 了 构造 函数 。 如 果 构 造 函 数 被 声明 为 constexpr， 且 构造 函数 的 参数 
是 常量 表达 式 ， 那 么 该 初始 化 就 是 一 个 常量 初始 化 〈constant initialization) 并 且 作 为 静 
态 初始 化 阶段 的 一 部 分 来 进行 。 这 是 C++11 中 为 并 发 而 设 的 最 重要 的 变化 之 一 , 通过 人 允 
许 用 户 自 定义 构造 函数 仍 可 进行 静态 初始 化 ， 你 可 以 在 其 初始 化 时 避免 所 有 的 竞争 条 
件 ， 因 为 保证 了 它们 在 所 有 代码 运行 前 就 被 初始 化 。 

以 上 对 于 像 std: :mutex (参见 3.2.1 节 ) 或 std::atomic<> (参见 5.2.6 节 ) 之 
类 的 特别 重要 一 一 你 可 能 想 要 使 用 一 个 全 局 实例 来 同步 访问 其 他 变量 , 并 在 访问 过 程 中 
避免 竞争 条 件 ， 而 如 果 互 斥 元 受 限 于 竞争 条 件 ， 前 面 所 述 的 就 将 无 法 实现 ， 所 以 
std: :mutex 的 默认 构造 函数 声明 为 constexpr， 以 确保 互 斥 元 的 初始 化 总 是 作为 静 
态 实例 化 阶段 的 一 部 分 来 完成 的 。 


49 个 元 素 


A.4.2 constexpr 对 象 


到 目前 为 止 我 们 看 到 constexpr 应 用 在 函数 上 ， 它 同样 可 以 被 应 用 于 对 象 。 这 主 
要 用 于 检测 目的 ， 它 可 以 确认 该 对 象 是 通过 常量 表达 式 、constexpr 构造 函数 或 由 常 
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量 表达 式 构成 的 初始 化 器 来 初始 化 的 。 它 也 会 将 对 象 声 明 为 const: 


constexpr int i-45; «— 正确 Shik, std::string 不 
constexpr std::string s("hello"),; 是 字面 值 类 型 
int foo(); 1 

constexpr int j-foo(); al 错误 ，foo0 并 未 声明 为 constexpr 


A.4.3 constexpr 函数 要 求 


为 了 将 一 个 函数 声明 为 constexpr, 它 必须 满足 一 些 要 求 。 如 果 不 满足 这 些 要 求 ， 
将 其 声明 为 constexpr 会 引起 编译 时 错误 。constexpr 函数 所 需 的 要 求 如 下 所 列 。 

图 ”所 有 的 参数 必须 是 字面 值 类 型 。 

图 ”返回 值 类 型 必须 是 字面 值 类 型 。 

Wb HAAR AHH return 语句 组 成 。 

m return 语句 中 的 表达 式 必须 是 常量 表达 式 。 

图 ”所 有 的 构造 函数 和 用 于 构造 表达 式 返 回 值 的 转换 运算 符 必须 是 constexpr, 

这 些 看 起 来 很 直接 : 你 必须 能 够 将 函数 内 骨 到 常量 表达 式 中 ,仍然 形成 一 个 常量 表 
达 式 ， 你 也 不 能 够 修改 任何 东西 。constexpr 函数 是 无 副作用 的 纯 函 数 。 

对 于 constexpr 类 成 员 函 数 ， 还 有 些 附加 的 要 求 。 

W constexpr AÑ Wak Ab XM. 

WO HAGARRHEPALARF OHARA, 

对 于 constexpr 构造 函数 ， 规 则 又 有 点 不 同 。 
构造 函数 体 必 须 是 空 的 。 
每 个 基 类 必须 被 初始 化 。 
每 个 非 静态 的 数据 成 员 必须 被 初始 化 。 
成 员 初 始 化 列表 中 使 用 的 所 有 表达 式 必须 具有 常量 表达 式 资质 . 
被 选中 用 以 初始 化 数据 成 员 和 基 类 的 构造 函数 必须 是 constexpr His HA, 
构造 数据 成 员 和 基 类 的 表达 式 里 所 使 用 到 的 所 有 构造 函数 和 转换 运算 符 都 必须 
X constexpr 的 。 

这 是 与 针对 函数 而 言 相同 的 一 组 规则 ,区 别 在 于 没有 返回 值 ， 所 以 没有 return if 
名 。 与 之 不 同 的 是 ， 构 造 函 数 在 成 员 初始 化 列表 中 初始 化 所 有 的 基 类 和 数据 成 员 。 平 凡 
的 拷贝 构造 函数 是 隐 式 的 constexpr, 


A.4.4 ”constexpr 与 模板 


如 果 模板 的 某 个 特定 实例 化 的 参数 和 返回 值 不 是 字面 值 类 型 ， 当 constexpr 被 应 
用 到 函数 模板 或 者 类 模板 的 成 员 函 数 上 的 时 候 ， 此 关键 字 会 被 忽略 。 这 就 允许 你 编写 这 
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样 的 函数 模板 , 当 模板 参数 类 型 合适 的 时 候 它 是 constexpr, 否则 就 是 普通 的 inline 
函数 ， 例 如 ， 


template<typename T» 
constexpr T sum(T a,T b) 


{ 


return a+b; 


正确 ,sum<int> 
constexpr int i-sum(3,42); 是 constexpr 
std::string s- 正确 ,但 sum<std::string> 
sum (std::string("hello"), 3 不 是 constexpr 
std::string(" world")); 


该 函数 必须 满足 作为 constexpr 函数 的 其 他 所 有 要 求 。 你 不 能 声明 一 个 具有 多 条 
语句 的 函数 为 constexpr 仅仅 因为 它 是 一 个 函数 模板 ， 这 仍然 是 编译 错误 。 


lambda 函数 是 C++11 标准 中 最 让 人 激动 的 特性 之 一 ， 因 为 它们 可 以 极 大 地 简化 代 
码 , 以 及 大 量 消除 与 编写 可 调用 对 象 相 关 的 样板 。C++11 lambda 函数 语法 允许 一 个 函数 
在 另 一 个 表达 式 中 需要 它 的 地 方 进行 定义 。 这 对 于 有 些 东西 非常 有 用 ， 如 提供 给 等 待 函 
数 std::condition variable 的 断言 (参见 4.1.1 节 ), 因为 它 允 许 语义 以 可 访问 
的 变量 的 形式 快速 被 表达 , 而 不 是 通过 一 个 函数 调用 操作 来 获取 类 中 成 员 变量 的 所 需 
状态 。 

一 个 最 简单 的 lambda 表达 式 定义 了 一 个 不 接受 参数 的 、 只 依赖 于 全 局 变量 和 函数 
的 自 包含 函数 ， 甚 至 不 必 返 回 值 。 这 样 的 lambda 表达 式 就 是 包括 在 一 对 花 括 号 中 的 一 
系列 语句 ， 之 前 缀 以 方 括号 (lambda 引导 符 )。 


üt < 一 以 [] 开 始 lambda 表达 式 
do stuff(); 
do more stuff(); 结束 lambda RER, 
AC 并 调用 之 


在 这 个 例子 中 ，lambda 表达 式 被 紧 随 其 后 的 一 对 括号 调用 了 ， 但 通常 并 不 这 样 做 。 
首先 ， 如 果 你 打算 直接 调用 它 ， 你 一 般 用 不 着 lambda， 而 是 将 语句 直接 写 在 源 代码 处 。 
更 通常 的 情况 是 ， 将 其 作为 参数 ， 传 给 接受 可 调用 对 象 作 为 参数 的 函数 模板 。 在 这 种 情 
况 下 ， 它 可 能 需要 接受 参数 ， 或 者 返回 一 个 值 ， 或 两 者 兼 有 。 如 果 需 要 接受 参数 ， 你 可 
以 像 普通 函数 那样 ， 在 lambda 引导 符 后 面 加 上 参数 列表 。 例 如 ， 下 面 一 段 代码 将 向 量 
的 所 有 元 素 写 人 std: :cout， 以 换行 为 分 隔 。 


std: :vector<int> data-make data(); 
std::for each(data.begin(),data.end(), [] (int i) (std: :cout<<i<<"\n";}); 


返回 值 几乎 同样 简单 。 如 果 lambda 函数 体 由 单条 return 语句 组 成 ， 那 么 lambda 
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的 返回 类 型 就 是 待 返回 表达 式 的 类 型 。 例 如 ， 你 可 能 会 用 类 似 下 面 所 示 的 简单 lambda , 
来 等 待 std: :condition variable (参见 4.1.1 节 ) 要 设置 的 标志 位 。 


清单 A.4 具有 推断 返回 类 型 的 简单 l ambda 


std: :condition variable cond; 
bool data ready; 
std::mutex m; 


void wait for data() 

{ 
std: :unique_lock<std::mutex> 1k(m) ; 
cond.wait (1k, [] {return data ready;]); 0 


} 

传 给 cond.wait()R lambda 返回 类 型 是 通过 data ready 的 类 型 推断 的 ， 即 
boo1。 一 旦 条 件 变量 从 等 待 中 被 唤醒 ， 接 下 来 就 会 调用 该 互 斥 元 锁定 的 lambda， 并 且 
只 会 在 data_ready Xj true 的 时 候 ， 从 对 wait O 的 调用 中 返回 。 

那 要 是 你 无 法 将 lambda 语句 体 写 成 单条 的 return 语句 呢 ? 这 种 情况 下 你 就 得 显 
式 指 定 返回 类 型 。 在 语句 体 只 有 一 条 return 语句 的 时 候 ， 你 依然 可 以 这 样 做 ， 但 如 果 
lambda 语句 体 更 为 复杂 的 时 候 ， 你 必须 这 样 做 。 返 回 类 型 是 通过 在 lambda 参数 列表 后 
跟 以 一 个 箭头 (>) 加 返回 类 型 的 方式 进行 指定 的 。 如 果 你 的 lambda 不 接受 任何 参数 ， 
你 仍然 需要 包含 空 的 参数 列表 ， 以 便 显 式 指定 返回 值 。 你 的 条 件 变量 预测 就 可 以 写成 ， 


cond.wait (1k, [] ()->bool{return data ready;]); 
通过 指定 返回 类 型 ， 你 可 以 扩展 这 个 lambda， 来 记录 消息 或 者 做 些 更 复杂 的 处 理 。 
cond.wait (1k, [] () ->bool{ 


if (data_ready) 

{ 
Std::cout««"Data ready”<<std::endl; 
return true; 


} 


else 
{ 
Std::cout««"Data not ready, resuming wait”<<std::endl; 
return false; 
p); 


尽管 像 这 样 的 简单 lambda 都 很 强大 并 能 够 极 大 地 精简 代码 ， 可 它们 的 真正 实力 是 
在 捕捉 局 部 变量 的 时 候 才 能 发 挥 出 来 。 


引用 局 部 变量 的 lambda 函数 


使 用 [] 作 为 lambda 引导 符 的 lambda 函数 不 能 引用 任何 包含 它 的 作用 域内 的 局 部 变 
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量 ， 它 们 只 能 使 用 全 局 变量 以 及 作为 参数 传人 的 东西 。 如 果 你 希望 访问 某 个 局 部 变量 ， 
你 需要 捕捉 它 。 最 简单 的 做 法 就 是 通过 使 用 [=] 作为 lambda 引导 符 , 来 捕捉 局 部 作用 域 
中 的 整个 变量 集 。 这 就 是 所 有 你 需要 做 的 一 一 你 的 lambda 现在 可 以 在 其 被 创建 的 时 候 
访问 局 部 变量 的 副本 。 

为 了 实际 地 了 解 这 一 点 ， 考 虑 下 面 这 个 简单 的 函数 。 


std: :function<int (int)> make offseter(int offset) 


return [=] (int j) {return offset+j;}; 


} 
每 次 调用 make offseter 都 会 通过 std: :function<> RA wee [8] —- 
新 的 lambda 函数 对 象 。 返 回 的 函数 会 将 所 提供 的 参数 添加 上 指定 的 偏 移 值 。 比 如 : 


int main() 


std::function«int(int)» offset 42-make offseter(42); 
std::function«int(int)» offset 123-make offseter(123); 
std: :cout<<offset_42(12) <<", "<<offset_123 (12) <<std::endl; 
std: :cout<<offset_42(12)<<", "<<offset_123(12)<<std::endl; 


} 

这 段 代码 会 输出 54, 135 两 次 ,因为 在 第 一 次 调用 make_offseter 时 返回 的 函数 ， 
总 是 将 所 提供 的 参数 加 42， 而 第 二 次 调用 make offseter 返回 的 函数 ， 总 是 将 所 提 
供 的 参数 加 123. 

这 是 捕捉 局 部 变量 的 最 安全 形式 , 一 切 都 是 被 复制 的 , 所 以 你 可 以 返回 一 个 lambda 
并 在 原 函数 作用 域 之 外 去 调用 它 。 但 这 并 非 唯一 的 选择 ， 相 反 的 ， 你 可 以 选择 通过 引用 
来 捕捉 所 有 的 东西 。 在 这 种 情况 下 ,一 旦 lambda 所 引用 的 变量 因为 离开 其 所 在 的 函数 
或 者 语句 块 作用 域 而 被 销毁 ， 调 用 该 lambda 就 成 为 一 种 未 定义 的 行为 ， 正 如 在 其 他 情 
况 下 引用 一 个 已 经 被 销毁 的 变量 一 样 。 

以 引用 的 方式 捕捉 所 有 局 部 变量 的 lambda 函数 使 用 [&] 来 引导 ， 如 下 面 的 例子 所 示 ， 


int main() 


{ 


int offset=42; 


std: :function<int (int)> offset a-[&](int j) {return offset+j;}; -© 
offset=123; 

std: :function<int (int)> offset b=[&] (int j){return offset+j;}; «-o 
std: :cout<<offset_a(12)<<","<<offset_b(12)<<std::endl; 

offset=99; 

std::coute«offset a(12)««","««offset b(12)««std::endl; —9 


) 

上 个 例子 中 ， 我 们 在 make offseter 函数 里 使 用 了 lambda 引导 符 [=] RAE 
移 量 的 副本 ， 这 个 例子 的 offset a 函数 使 用 lambda 引导 符 [&] ， 通 过 引用 来 捕捉 
offset6, offset 的 初始 值 是 否 为 42@ 并 不 重要 , 调用 offset_a (12) 的 结果 总 是 
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取决 于 offset 的 当前 值 ,尽管 我 们 是 在 制造 第 二 个 (相同 的 )lambda 函数 offset_b@ 
之 前 就 将 offset 值 改 为 7 了 123@, 由 于 第 二 个 lambda 还 是 通过 引用 进行 捕捉 的 ， 所 以 
结果 取决 于 offset 的 当前 值 。 

现在 , 当 我 们 打印 第 一 行 输出 的 时 候 @,offset 仍然 是 123, 所 以 输出 是 135, 135。 
然而 ， 在 第 二 行 输出 的 地 方 @ ，offset 已 经 被 改 为 90, ， 所 以 这 时 候 的 输出 是 
111,111, offset a 和 offset b 都 是 将 offset 的 当前 值 (99) 加 到 所 提供 的 参 
X (12) L. 

其 实 ，C++ 之 所 以 称 为 CH+， 你 并 不 会 受 困 于 这 些 非 黑 即 白 的 选项 ， 你 可 以 选择 通 
过 复制 捕捉 一 部 分 参数 ， 然 后 通过 引用 捕捉 一 部 分 ， 并 且 你 可 以 选择 仅仅 捕捉 你 显 式 选 
定 的 那些 变量 ， 这 些 都 可 以 通过 调整 lambda 引导 符 实现 。 如 果 你 希望 复制 所 有 用 到 的 
变量 , 但 是 有 一 两 个 例外 , 你 可 以 使 用 lambda 引导 符 的 [=] 形式 , 然后 在 等 号 后 面 跟 上 
引用 捕 换 的 变量 列表 ， 变 量 之 前 冠 以 & 符 号 。 下 面 的 例子 将 会 打印 1239， 因 为 i 被 复 
制 进 lambda， 而 了 和 kk 是 引用 捕捉 的 。 
int main() 

int i-1234,7-5678,k-9; 

std::function<int()> f=[=,&j,&k] {return i+j+k;}; 

me 


X23; 
Std::cout««f () ««std: :endl; 


另外 ， 你 可 以 默认 引用 捕捉 ， 但 是 通过 复制 捕捉 变量 的 一 个 指定 子 集 。 在 这 种 情况 
下 ， 使 用 lambda 引导 符 的 [&] 形式 ， 但 在 号 后 面 跟 以 复制 捕捉 的 变量 列表 。 下 面 的 例 
子 会 打印 5688， 因 为 i 是 引用 捕捉 的 ， 而 j 和 kk 是 复制 的 。 
int main() 

int 121234,3-25678,ks9; 

std: :functioncint () > f=[&,j,k] {return i+j+k;}; 

"e 

k=3; 

std: :cout<<f()<<std::endl; 


如 果 你 只 想 捕捉 提名 的 变量 ， 你 可 以 省 略 前 面 的 = 或 &， 仅 仅 列 出 需要 捕捉 的 变量 ， 
通过 前 缀 & 符 号 来 表明 引用 捕捉 而 非 复制 。 下 面 的 代码 将 会 打印 5682， 因 为 i 和 kk 通 
过 引用 捕捉 ， 而 j 是 复制 的 。 
int main() 


int i1=1234,3=5678,k=9; 
Std::functioncint()» f-[&i,j,&k]([return i+j+k;}; 


::cout<<f ()<<std::endl; 


} 


最 后 这 个 变化 形式 允许 你 确保 只 有 意料 之 中 的 变量 被 捕捉 ,因为 引用 任何 不 在 捕捉 
列表 中 的 局 部 变量 都 会 导致 编译 时 错误 。 如 果 你 选择 了 这 个 选项 ， 而 包含 lambda RUP 
数 又 是 一 个 成 员 函 数 ， 你 就 得 小 心地 访问 类 成 员 。 

类 成 员 不 能 被 直接 捕捉 ， 如 果 你 希望 从 lambda 中 访问 类 成 员 ， 你 必须 将 this fü 
针 添加 到 捕捉 列表 中 先行 捕 担 。 在 下 面 的 例子 中 ，lambda 捕捉 了 this， 以 允许 访问 类 
成 员 some data。 


struct X 


int some data; 
void foo(std::vector«int»& vec) 


std::for each(vec.begin(),vec.end(), 
[this] (int& i)(i«-some data;)); 
: } 
在 并 发 的 上 下 文中 ,lambda 表达 式 最 大 的 用 处 是 作为 std: :condition_variable:: 
wait () (参见 4.1.1 节 ) 以 及 std: :packaged task<> (参见 42.1 节 ) 的 断言 , 或 是 打 
包 小 任务 的 线程 池 。 它 们 也 能 作为 线程 函数 (参见 2.1.1 节 ) 传 给 std: :thread 的 构造 函 


数 ， 或 是 作为 使 用 并 行 算法 的 函数 ， 比 如 parallel_for_each () (参见 8.5.1 节 )。 


变 参 模板 


变 参 模板 ， 指 的 是 参数 数量 可 变 的 模板 。 正 如 你 一 直 以 来 使 用 的 变 参 函 数 一 样 ， 比 
如 printf 就 可 以 接受 可 变数 量 的 参数 ， 你 现在 有 了 模板 参数 数量 可 变 的 变 参 模板 。 
变 参 模板 的 使 用 贯穿 整个 C++ 线程 库 。 比 如 ，std: :上 thread FRA aA AEM E R 
数 (参见 2.1.1 节 ) 就 是 一 个 变 参 函数 模板 ，std: :Packaged _ task<> (参见 422 
节 ) 是 一 个 变 参 类 模板 。 从 使 用 者 的 角度 来 看 ， 知 道 这 个 模板 可 以 接受 不 限 数量 的 参 
数 就 足够 了 ， 但 如 果 你 想 编写 一 个 这 样 的 模板 ， 或 者 你 对 它 是 如 何 工作 的 感 兴趣 ， 你 
就 需要 知道 其 中 的 细节 。 

变 参 函数 是 通过 函数 参数 列表 中 的 省 略 号 (...) 来 声明 的 ， 与 之 类 似 ， 变 参 模板 
的 声明 方式 ， 是 在 模板 参数 列表 中 的 省 略 号 。 


template<typename ... ParameterPack» 
class my template 


{}; 
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你 也 可 以 在 模板 偏 特 化 中 使 用 变 参 模板 ， 即 便 是 主 模板 并 非 变 参 的 。 比 如 ， 
std: :Packaged task<> (参见 4.2.1 节 ) 的 主 模板 只 是 一 个 带 有 单个 模板 参数 的 简单 模板 。 


template<typename FunctionType> 
class packaged_task; 


然而 ， 该 主 模板 没有 在 任何 地 方 进行 定义 ， 它 仅仅 是 作为 偏 特 化 的 占 位 标志 。 


template<typename ReturnType,typename ... Args> 
class packaged task«ReturnType (Args...)»; 


正 是 这 一 偏 特 化 里 包含 了 该 类 的 真正 定义 。 在 第 4 章 中 ， 你 见 过 这 样 的 写法 ， 
用 std: :packaged task«int(std::string, double) > 来 声明 一 个 在 调用 时 
接受 std::string 和 double 作为 参数 的 任务 ， 然 后 通过 std::future<int> 
提供 结果 。 

该 声明 展示 了 变 参 模板 的 另外 两 项 特性 。 第 一 个 特性 相对 简单 ， 你 可 以 在 一 个 声明 
中 同时 包含 普通 的 模板 参数 (比如 ReturnType) 和 变 参 (Args )。 第 二 个 特性 演示 了 
在 特 化 的 模板 参数 列表 中 Args. . .的 用 法 ， 显 示 了 当 模 板 实例 化 时 组 成 Args 的 类 型 
会 在 这 里 列 出 。 事 实 上 由 于 这 是 偏 特 化 ， 它 按照 模式 匹配 来 工作 ， 在 实际 的 实例 化 中 ， 
此 上 下 文中 出 现 的 类 型 会 被 捕捉 为 Args。 变 参 Args 称 为 参数 包 (parameter pack), 
而 对 Azgs.… 的 使 用 称 为 包 展开 (pack expansion), 

与 变 参 函数 类 似 ， 变 参 部 分 既 可 以 是 空 列表 也 可 以 有 很 多 条 目 。 比 如 ， 在 
Std::packaged task«my class()»'H ReturnType 参数 是 my class, Args & 
数 包 是 空 的 ， 然 而 在 std::packaged task«void(int, double, my classé, 
std::string*) > ReturnType # void, Args Æ int, double, my classé, 
std: :string* 的 列表 。 


展开 参数 包 


变 参 模板 的 强大 之 处 ， 体 现在 你 如 何 去 进 行 包 的 展开 ， 即 你 并 不 局 限于 仅仅 将 类 型 
列表 原样 展开 。 首 先 ， 你 可 以 在 任何 需要 类 型 列表 的 地 方 直接 使 用 包 展 开 ， 比 如 另 一 个 
模板 的 参数 列表 。 


template<typename ... Params> 
struct dummy 


{ 
E 


std: :tuple<Params...> data; 


在 这 个 例子 中 ， 唯 一 的 成 员 变量 data Æ std: :tuple<> 的 一 个 实例 ， 它 包含 了 
所 有 指定 的 类 型 ,所 以 dummy<int, double，char> 拥 有 类 型 为 std: :tuple<int， 
double，char> 的 成 员 。 你 可 以 用 普通 类 型 来 整合 包 展 开 。 
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template<typename ... Params> 
struct dummy2 


{ 


std: :tuple<std::string, Params...> data; 


P 

这 一 次 ， 此 元 组 有 一 个 额外 的 (第 一 个 ) std::string 类 型 的 成 员 。 有 趣 的 部 分 
是 你 可 以 使 用 包 展 开创 建 一 个 模式 ， 它 接 下 来 会 针对 每 一 个 展开 的 元 素 复制 。 你 通过 将 
标识 包 展 开 的 …… 放 到 模式 的 末尾 来 做 到 这 一 点 。 例 如 ， 不 是 仅 创建 你 的 参数 包 里 提供 
的 元 素 元 组 ， 而 是 可 以 创建 指向 这 些 元 素 的 指针 元 组 ， 或 者 甚至 指向 你 的 元 素 的 
std: :unigque ptr<> 元 组 . 


template<typename ... Params> 
struct dummy3 


std::tuple<Params* ...> pointers; 
std: :tuple<std: :unique ptr«Params» ...» unique pointers; 


hi 

类 型 表达 式 可 以 如 你 所 想 的 那样 复杂 ， 前 提 是 参数 包 出 现在 类 型 表达 式 中 ， 并 且 该 
表达 式 后 面 跟着 标识 展开 的 ……。 当 参数 包 被 展开 时 , 包 里 的 每 一 项 会 代 人 类 型 表达 式 ， 
以 生成 结果 列表 中 的 相应 项 。 因 此 ， 如 果 你 的 参数 包 Params 包含 int,int,char 的 
类 型 , HRA std::tuple<std: :pair<std::unique_ptr<Params>,double>.. .> 的 
展开 就 是 std: :tuple<std: :pair<std::unique ptr<int>,double>,std:: 
pair«std::uniqueptr«int»,double»,std::pair«std::unique ptr<char>, 
double>>。 如 果 包 展开 被 用 作 模 板 参数 列表 ， 该 模板 无 需 具 有 变 参 ， 但 如 果 它 确实 没 
有 ， 那 么 包 的 大 小 必须 恰好 匹配 模板 参数 要 求 的 数量 。 
template<typename ... Types> 


struct dummy4 


{ 
Std::pair«Types...» data; 
Fi IEMA, data 是 std::pair 


dummy4<int,char> a; <int,char> ^ 错误 ， 没 有 第 二 个 
dummy4«int» b; ,9 、 Y 类 型 
dummy4«int,int,int» c; 错误 ， 类 型 过 多 


你 可 以 对 包 展开 做 的 第 二 件 事 情 ， 是 用 它 来 声明 一 个 函数 参数 列表 。 


template<typename ... Args> 
void foo(Args ... args); 


这 样 创建 一 个 新 的 参数 包 args， 它 是 函数 参数 的 列表 而 不 是 类 型 的 列表 ， 你 可 以 
像 之 前 那样 用 . . .来 展开 它 。 现 在 ， 你 可 以 用 带 有 包 展 开 的 模式 来 声明 函数 参数 ， 正 如 
你 在 其 他 地 方 使 用 的 展开 包 模式 一 样 。 比 如 ，std: :thread 利用 它 来 通过 右 值 引用 接 
受 所 有 的 函数 参数 (参见 ALT): 


template<typename CallableType,typename ... Args> 
thread::thread(CallableType&& func,Args&& ... args); 
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这 个 函数 参数 包 可 以 用 来 通过 在 被 调用 函数 的 参数 列表 里 指定 包 展开 ， 来 调用 另 一 个 
函数 。 正 如 类 型 展开 一 样 ， 你 可 以 为 结果 参数 列表 里 的 每 个 表达 式 使 用 一 个 模式 。 例 如 ， 
一 个 常见 的 右 值 引用 习惯 用 法 是 使 用 std: : forward<> 来 保持 所 提供 函数 参数 的 右 值 性 : 


template<typename ... ArgTypes> 
void bar(ArgTypes&& ... args) 


{ 
} 


foo (std: : forward<ArgTypes> (args) ...); 


注意 在 这 个 例子 里 ， 包 展开 同时 包含 了 类 型 包 ArgTypes 和 函数 参数 包 args, VÀ 
及 整个 表达 式 后 面 的 省 略 号 。 如 果 你 像 这 样 调用 bar; 
intl; 


barí(i,3.141,5td::string("hello ")); 


那么 展开 成 为 : 


template<> 

void bar«int&,double,std::string»( 
int& args 1, 
double&& args 2, 
std::string&& args 3) 


foo(std::forward«int&» (args 1), 
Std::forward«double» (args 2), 
std::forward«std::string» (args 3)); 


正确 地 将 第 一 个 参数 作为 左 值 引用 传递 给 foo， 同 时 将 以 右 值 引用 传递 另 一 个 参数 。 

你 可 以 对 参数 展开 做 的 最 后 一 件 事 是 使 用 sizeof .. .操作 符 来 获取 其 大 小 。 这 是 
非常 简单 的 , sizeof... (p) 就 是 参数 包 p 中 的 元 素 个 数 。 无 论 是 类 型 参数 包 还 是 函数 
参数 包 ， 结 果 都 是 一 样 的 。 这 可 能 是 唯一 一 个 你 可 以 使 用 参数 包 并 且 不 在 后 面 跟 上 和 省略 
号 的 情况 ， 省 略 号 已 经 是 sizeof.. .运算 符 的 一 部 分 。 下 面 的 函数 返回 提供 给 它 的 参 


数 个 数 ， 

template<typename ... Args» 

unsigned count args(Args ... args) 
return sizeof... (Args); 


) 
如 同 普通 的 sizeof 运算 符 ，sizeof .. .的 结果 是 一 个 常量 表达 式 ， 所 以 它 可 以 
被 用 来 指定 数组 的 边界 等 等 。 


A] 自动 推断 变量 的 类 型 


C++ 是 一 门 静 态 类 型 语言 ， 每 个 变量 的 类 型 在 编译 时 都 是 已 知 的 。 不 仅 如 此 ， 作 为 
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程序 员 , 你 还 得 指定 每 个 变量 的 类 型 。 在 某 些 情况 下 , 这 将 导致 非常 笨拙 的 名 字 , 例如 ， 


std: :map<std: :string, std: :unique ptr«some data»» m; 
std: :map<std: : string, std: :unique ptr«some data>>::iterator 
iter=m.find("my key"); 


传统 上 ， 有 个 解决 方案 那 就 是 使 用 typedef 来 减少 类 型 标识 符 的 长 度 ， 并 有 可 能 
消除 类 型 不 一 致 的 问题 。 这 在 CHL 中 仍然 有 效 , 但 现在 有 了 一 种 新 的 方式 ， 如 果 一 个 
变量 在 其 声明 中 初始 化 自 一 个 相同 类 型 的 值 ， 那 么 你 可 以 将 类 型 指定 为 auto。 在 这 种 
情况 下 , 编译 器 将 自动 推断 变量 的 类 型 与 初始 化 器 相同 。 于是, 该 送 代 咒 示例 可 以 写作 


auto iter=m.find("my key"); 


— 现在， 你 不 限于 只 是 普通 的 auto， 你 可 以 修饰 它 来 声明 const 变量 、 指 针 或 引用 
变量 。 这 里 有 几 个 使 用 auto 的 变量 声明 及 其 相应 的 变量 类 型 


auto i=42; y foci 
auto& j=i; // int& 
auto const k=i; // int const 


auto* const ps&i; // int * const 
推断 变量 类 型 的 规则 ， 基 于 该 语言 在 其 他 地 方 推断 类 型 的 规则 ， 函数 模板 的 参数 。 
在 形 如 下 面 格式 的 声明 中 ， 


some-type-expression-involving-auto var=some-expression; 


var 的 类 型 与 用 相同 表达 式 推断 出 的 函数 模板 参数 相同 ， 区 别 在 于 将 auto 蔡 换 成 
了 模板 参数 的 名 字 : 


template<typename T> 
void f(type-expression var); 
f (some-expression); 


这 意味 着 数组 类 型 衰变 到 指针 和 引用 都 被 丢弃 ， 除 非 该 类 型 表达 式 显 式 声 明 变 量 为 
引用 ,例如 : 


int some array[45]; 


auto p-some array; if fe ints 
int& r=*p; 

auto x=r; L7. int 
auto& y=r; // int& 


这 可 大 大 简化 变量 的 声明 , 特别 是 完整 的 类 型 标识 符 很 长 ,或 者 干脆 不 可 知 〈 例 如 ， 
在 一 个 模板 中 的 函数 调用 的 结果 的 类 型 ) 。 


线程 局 部 变量 


线程 局 部 变量 可 以 在 程序 中 让 你 为 每 个 线程 拥有 独立 的 变量 实例 。 在 声明 变量 时 ， 
可 以 用 thread local 关键 字 进 行 标 记 ， 表 明 它 是 线程 局 部 的 。 命 名 空间 范围 的 变量 、 
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类 的 静态 数据 成 员 和 局 部 变量 都 可 被 声明 为 线程 局 部 的 ， 也 就 是 说 ， 具 有 线程 存储 期 


(thread storage duration), 


命名 空间 范围 内 的 线 
L4 i 
thread_local int x a 程 局 部 变量 
RS 线程 局 部 的 静态 类 数 
| Static thread local std tring 据 成 员 
i e tug S; 
; ey 需要 Xs 的 
Static thread local std::string X ay 定义 


void foo() 


is 线程 局 部 的 局 部 
thread local std::vector«int» v; 变量 


) 


命名 空间 范围 的 线程 局 部 变量 和 线程 局 部 的 静态 类 数据 成 员 , 在 相同 的 翻译 单元 里 
的 首次 使 用 之 前 被 构造 ,但 并 没有 指定 要 提前 多 久 。 有 些 实现 方式 可 能 在 线程 启动 时 构 
造 线程 局 部 变量 ， 有 些 则 可 能 在 他 们 被 各 自 线程 初次 使 用 之 前 就 立即 构造 了 ， 还 有 些 可 
能 在 其 他 的 时 点 进行 构造 ， 或 是 根据 其 用 途上 下 文 的 某 种 组 合 。 事 实 上 ， 如 果 没 有 一 个 
来 自给 定 的 翻译 单元 的 线程 局 部 变量 被 使 用 ， 则 压根 就 不 会 保证 他 们 会 被 构造 。 这 就 允 
许 动态 加 载 的 模块 包含 线程 局 部 变量 一 一 这 些 变量 可 以 在 来 自动 态 加 载 模块 的 线程 首 
次 引用 线程 局 部 变量 的 时 候 被 构造 。 

在 函数 内 声明 的 线程 局 部 变量 , 是 在 给 定 线程 的 控制 流 第 一 次 通过 其 声明 时 初始 化 
的 。 如 果 不 由 给 定 的 线程 调用 该 函数 ， 则 函数 内 的 任何 线程 局 部 变量 都 不 被 构造 。 这 一 
行为 与 局 部 静态 变量 是 一 样 的 ， 区 别 在 于 它 分 别 适 用 于 每 个 线程 。 

线程 局 部 变量 与 静态 变量 共享 其 他 属性 一 一 他 们 在 所 有 进一步 初始 化 (如 动态 初始 
化 ) 之 前 是 零 初始 化 的 如果 线 程 本 地 变量 的 构造 引发 异常 , 则 调用 std: : terminate () 
来 中 止 应 用 程序 。 

所 有 在 给 定 线程 上 构造 的 线程 局 部 变量 的 析 构 函数 ， 运 行 于 在 线程 函数 返回 时 ， 与 
构造 函数 是 相反 的 顺序 。 由 于 初始 化 的 顺序 是 未 指定 的 ， 因 此 确保 这 种 变量 的 析 构 函数 
之 间 没有 相互 依存 关系 是 很 重要 的 。 如 果 一 个 线程 局 部 变量 的 析 构 函数 以 异常 退出 ， 
std::terminate () 会 被 调用 ， 与 构造 相 类 似 。 

如 果 一 个 线程 调用 std: :exit() 或 从 main () 返 回 (EAFA main O 的 返 
回 值 调用 sta: :exit () )， 那 么 该 线程 的 线程 局 部 变量 也 会 被 销毁 。 如 果 任 何其 
他 线程 在 应 用 程序 退出 时 仍 在 运行 ， 那 些 线程 的 线程 局 部 变量 的 析 构 函数 不 会 被 
调用 。 

虽然 线程 局 部 变量 的 每 个 线程 上 有 一 个 不 同 的 地 址 , 你 仍然 可 以 获得 指向 这 种 变量 
的 普通 指针 。 该 指针 将 引用 拥有 该 地 址 的 线程 中 的 对 象 ， 并 可 以 用 来 允许 其 他 线程 访问 
该 对 象 。 在 一 个 对 象 被 销毁 后 再 去 访问 它 是 未 定义 的 行为 (一 直 都 是 ) ， 所 以 如 果 将 指 
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向 一 个 线程 局 部 变量 的 指针 传 给 另 一 个 线程 的 线程 ,你 需要 确保 它 在 其 所 属 线程 结束 后 
不 被 解 引用 。 


小 结 


本 附录 只 是 足 了 一 下 C++ 标 准 引入 的 新 语言 特性 的 皮毛 ， 因 为 我 们 只 看 了 那些 对 
Thread 库 有 积极 影响 的 功能 。 其 他 新 的 语言 功能 包括 静态 断言 、 强 类 型 的 枚 举 、 委 派 构 
造 函数 、Unicode 支持 、 模 板 别名 和 一 个 新 的 统一 的 初始 化 序列 ， 以 及 一 系列 较 小 变化 。 
描述 所 有 新 功能 的 详细 信息 不 在 本 书 的 范围 之 内 ， 可 能 需要 另 一 本 专门 的 书 。 目 前 , 对 
完整 的 标准 变更 最 好 的 概览 , 大 概 是 Bjarne Stroustrup 的 C++11 常见 问题 解答 ', 而 流行 
的 C++ 参考 书 为 了 涵盖 它 会 及 时 地 作出 修订 。 

希望 本 附录 中 所 涵盖 的 新 功能 简介 提供 了 足够 的 深度 ， 以 展示 它们 与 Thread 库 有 
着 怎样 的 关系 ， 并 使 你 能 够 编写 和 理解 使 用 这 些 新 功能 的 多 线程 的 代码 。 虽 然 本 附录 本 
应 为 这 些 特性 所 涵盖 简单 用 途 提供 足够 的 深度 ,但 这 仍然 只 是 一 份 简 介 ， 并 不 是 使 用 这 
些 功能 的 完整 的 参考 或 教程 。 如 果 你 打算 将 它们 广泛 地 使 用 ， 我 建议 获取 一 份 这 样 的 参 
考 或 教程 ， 以 便 从 中 获得 最 大 的 益处 。 


1 http;//www.research.att.com/-bs/C4--0xFAQ.html 
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编程 语言 和 类 库 对 并 发 与 多 线程 的 支持 并 非 新 生 事物 , 它们 只 是 最 近 才 在 C++ 标准 
中 得 到 支持 。 比 如 ，Java 自发 布 起 就 拥有 多 线程 支持 ， 兼 容 POSIX 标准 的 平台 提供 了 
用 于 多 线程 的 C 语言 接口 ，Erlang 提供 了 信息 传递 并 发 的 支持 。 甚 至 还 有 些 类 似 Boost 
一 样 的 C++ 库 , 将 各 种 平台 的 底层 多 线程 编程 接口 (POSIX C 接口 或 其 他 ) 进行 了 封装 ， 
具备 跨 平 台 的 可 移植 性 。 

对 那些 已 经 有 多 线程 应 用 编写 经 验 , 并 且 希 望 利用 这 些 经 验 来 使 用 新 的 C++ 多 线程 
工具 编写 代码 的 人 而 言 ， 本 附录 提供 了 Java, POSIX C、C++ Boost 线程 库 与 C11 中 
可 用 工具 的 对 比 ， 同 时 包括 本 书 中 相关 章节 的 交叉 引用 。 


pthread t 类 型 和 相关 API BR: 
pthread create(). pthread detach() 
#0 pthread join() 


boost:thread 类 与 成 员 
函数 


java.lang.thread 3€ std:thread 类 与 成 员 函 数 | $82 85 


pthread mutex t 类 型 和 相关 API | boost:mutex 类 与 成 员 函 | std:mutex 类 与 成 员 画 


BR synchronized $ Bi: pthread mutex lock(). | X, boost:lock guard<> 和 | 数 std::lock_guard<> 和 | 第 3 章 
pthread_mutex_unlock()= boost:unique lock<> 模 板 std::unique lock<> 模 板 
java.lang.Object 类 Sis 3 » ns b 
监控 /等 待 的 wait OW] notify O pthread cond t 类 型 与 相关 API | boost:condition variable 和 std::condition variable 和 
预期 方法 , 在 synchronized 函数 : pthread cond wait() . boost::condition variable | std::condition variable an | $84 & 
B 内 使 用 pthread cond timed wait()&& _any 类 与 成 员 函 数 y 类 与 成 员 函 数 
原子 操作 与 | volatie 变量 ， 位 于 varie t 
并 发 感知 内 | java.util.concurrent.atomi i "t ^ | $852 
存 模 型 c 包 中 zatomic | | fence() 
BA 
ae java.util.concurrent & 中 第 6 S70 
线程 安全 容器 的 容器 不 可 用 Za 


boost:unique future<> 和 
boost:shared future<> 


类 模板 


boost::thread 类 的 


std:future«» std::shared_ 
future<> 和 std::atomic - 


future<> 类 模板 


java.util.concurrent.future 


接口 及 相关 类 


future 


(ipae BIE ÉM 
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在 第 4 章 中 ， 我 展示 了 一 个 在 线程 之 间 使 用 消息 传递 框架 来 传递 消息 的 例子 ， 
其 中 简单 实现 了 ATM 中 的 代码 。 下 面 给 出 该 示例 的 完整 代码 ， 其 中 包含 了 消息 传 
递 框架 。 

清单 C.1 展示 了 消息 队列 。 其 中 以 指向 基 类 的 指针 存放 了 一 列 消息 ， 特 定 的 消息 类 
别 使 用 从 该 基 类 派生 的 类 模板 来 处 理 。 压 入 一 个 条 目 ， 即 是 构造 一 个 包装 类 的 相应 实例 
并 且 存 储 一 个 指向 它 的 指针 。 弹 出 一 个 条 目 ， 即 是 返回 该 指针 。 由 于 message base 
类 没有 任何 成 员 函 数 ， 弹 出 线程 在 能 够 访问 存储 的 消息 之 前 ， 需 要 将 此 指针 转换 为 一 个 
合适 的 wrapped message<T> 指 针 。 


清单 C.1 简单 的 消息 队列 


#include <mutex> 

#include <condition_variable> 
#include <queue> 

#include <memory> 


oor messaging S 我 们 的 队列 项 目的 
Struct message base 基 类 


virtual ~message base() 
Ü 
hi 
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template<typename Msg» 


struct wrapped message: 每 个 消息 类 型 有 特殊 
message base 定义 


Msg contents; 


explicit wrapped message(Msg const& contents ): 
contents (contents ) 
ü 


h 我 们 的 消息 
class queue 队列 
{ x 
std: :mutex m; 实际 的 队列 存储 message 
std::condition variable c; base 的 指针 
std: :queue<std: :shared_ptr<message_base> > q; 


public: 
template<typename T> 将 发 出 的 消 
void push(T const& msg) 息 封 装 并 且 
{ 存储 指针 


Std::lock guard«std::mutex» lk(m); 
q.push(std::make_shared<wrapped_message<T> > (msg)) ; 
c.notify arly 


Std::shared ptr«message base» wait and pop() 


std: :unique lock«std::mutex» 1k (m) ; 阻塞 直到 队列 
c.wait (1k, [&] {return !q.empty();}); 非 空 

auto res-q.front(); 

q.popO ; 


return res; 


1; 


发 送 消息 是 通过 清单 C.2 所 示 的 sender 类 实例 来 处 理 的 。 它 仅仅 是 对 消息 队列 的 简单 


包装 ， 只 允许 消息 被 压 人 。 复 制 sender 的 实例 仅仅 复制 指向 队列 的 指针 ， 而 非 队列 本 身 。 


清单 C.2 sender 类 


namespace messaging 


{ 


class sender 


{ sender 就 是 封装 了 队 
iie. d E 默认 构造 的 sender 3t 
sender(): 有 队列 
q(nullptr) 
» 允许 从 指向 队列 的 指 
explicit sender (queue*q_): 针 进 行 构造 


q(q ) 
{} 
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template<typename Message» 
void send(Message const& msg) 


{ 
E (q) 在 队列 上 发 送 推送 
q-»push (msg) ; 消息 
} 
} 
py 


接收 消息 要 稍微 复杂 一 点 。 你 不 仅 要 等 待 队 列 中 的 消息 ， 还 需要 检查 其 类 型 是 否 符 
合 所 等 待 的 消息 类 型 ， 并 且 调 用 相应 的 处 理 函数 。 这 些 都 始 于 清单 C3 中 展示 的 


receiver 类 。 


清单 C.3 receiver 类 


namespace messaging 


{ 


class receiver 


{ 一 个 receiver 拥有 
di 此 队列 允许 隐 式 转换 到 引用 队 
public: 列 的 sender 
operator sender() 
return sender(&q); 
} 等 待 队列 创建 
dispatcher wait() 调度 器 


{ 


return dispatcher (&q) ; 
} 
E 


与 sender 仅仅 引用 一 个 消息 队列 不 同 ,receiver 拥有 它 。 你 可 以 使 用 隐 式 转换 
来 获得 一 个 引用 该 队列 的 sender 类 。 进 行 消息 调度 的 复杂 性 始 于 对 wait O 的 调用 ， 
这 将 创建 一 个 dispatcher HR, EM receiver 中 引用 该 队列 。di spatcher KE 
示 在 下 一 个 清单 中 ， 正 如 你 所 见 ， 这 项 工作 是 在 析 构 函数 中 完成 的 。 在 清单 C.4 的 例子 
中 ， 此 工作 是 由 等 待 消息 和 调度 消息 组 成 的 。 


清单 C.4 dispatcher 类 


namespace messaging 用 来 关闭 队列 的 


class close queue 消息 


class dispatcher 


{ 
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queue* q; 
bool chained; 不 能 复制 的 调度 器 
dispatcher (dispatcher const &) =delete; 实例 


dispatcher& operator- (dispatcher const&) =delete; 


template< 


typename Dispatcher, ^ E z 
typename Msg, 允许 TemplateDispatcher 实例 访 


typename Func» 问 内 部 成 员 


friend class TemplateDispatcher; 


void wait and dispatch() 


{ 循环 ， 等 待 和 
for (;;) 调度 消息 
: auto msg=q->wait_and pop(); 
dispatch (msg); ) 
) dispatch0 检 查 close queue 消息 ， 
} 并 抛 册 


bool dispatch( 
std::shared ptr«message base» const& msg) 


{ 


if (dynamic_cast<wrapped_message<close_queue>*>(msg.get () ) ) 


{ 
throw close queue(); 
) 
return false; 
) 
public: 调度 器 实例 可 以 
dispatcher (dispatcher&& other): 被 移动 
q(other.q),chained(other.chained) 
{ 
other.chained=true; 来 源 不 得 等 待 
消息 


explicit dispatcher(queue* q ): 
q(q ),chained(false) 
{} 


template<typename Message,typename Func> 使 用 TemplateDispatcher 
TemplateDispatcher<dispatcher, Message, Func> 处 理 特 定 类 型 的 消息 
handle (Func&& f) 

{ 


return TemplateDispatcher<dispatcher, Message, Func> ( 
q,this,std::forward«Func»(f)); 


) 


-dispatcher() noexcept (false) 


i 析 构 函数 可 能 扫 出 


if (!chained) 异常 


{ 


wait and dispatch(); 
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从 wait () 返回 的 dispatcher 实例 将 会 被 立刻 销毁 ， 因 为 它 是 临时 的 ， 并 且 如 
前 所 述 ， 析 构 函 数 承担 了 这 项 工作 。 析 构 函 数 调 用 wait and dispatch, ， 这 是 一 
个 等 待 消息 并 将 其 传递 给 dispatch () WMA O, dispatch) 本 身 e 非常 简单 ， 它 
检查 消息 是 否 为 一 个 close queue 消息 ， 如 果 是 ， 就 抛 出 一 个 异常 ， 否 则 ， 它 返回 
false 来 指示 该 消息 未 被 处 理 。close queue 异常 正 是 析 构 函数 被 标记 为 
noexcept (false) 的 原因 ， 如 果 没 有 这 个 注解 ， 析 构 函 数 的 默认 异常 规定 将 会 是 
noexcept (true) 0, 表明 没有 异常 能 够 被 抛 出 , 那么 close queue 异常 就 会 终止 
程序 。 

然而 你 并 非 经 常 去 主动 调用 wait () ， 大 部 分 时 间 你 会 希望 去 处 理 一 个 消息 。 这 就 
Æ handle () 成 员 函 数 @ 的 用 武之 地 。 它 是 一 个 模板 ， 并 且 消 息 类 型 是 无 法 推断 的 ， 所 
以 你 必须 指定 待 处 理 的 消息 类 型 ， 并 且 传 入 一 个 函数 (或 者 可 调用 的 对 象 ) 来 处 理 它 。 
handle() 自身 将 队列 、 当 前 的 dispatcher 对 象 和 处 理 函 数 传递 给 一 个 新 的 
TemplateDispatcher 类 模板 的 实例 ， 来 处 理 指定 类 型 的 消息 ， 这 些 展 示 在 清单 
C.5 的 例子 中 。 为 什么 要 在 等 待 消息 之 前 就 在 析 构 函数 里 测试 chained 的 值 呢 ? 
因为 这 样 不 仅 可 以 防止 移入 的 对 象 等 待 消息 , 而 且 允 许 你 将 等 待 消息 的 重任 交 给 新 
的 TemplateDispatcher 实例 。 


清单 C.5  TemplateDispatcher 类 模板 


namespace messaging 


template<typename PreviousDispatcher, typename Msg,typename Func» 
class TemplateDispatcher 
{ 

queue* q; 

PreviousDispatcher* prev; 

Func £; 

bool chained; 


TemplateDispatcher (TemplateDispatcher const&) =delete; 
TemplateDispatcher& operator=(TemplateDispatcher const&) =delete; 


template<typename Dispatcher,typename OtherMsg, typename OtherFunc> 


friend class TemplateDispatcher; ‘ x 
P E TemplateDispatcher 实例 之 间 互 为 
void wait and dispatch() AJ 
{ 
for(;;) 
{ 
auto msg=q->wait_and_pop() ; 
if (dispatch (msg) ) 
break; 
} 


如 果 我 们 处 理 了 消息 ， 
Pac 跳出 循环 


) 


bool dispatch(std::shared ptr«message base» const& msg) 
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if (wrapped message«Msg»* wrapper- 


dynamic cast«wrapped message«Msg»*» (msg.get ())) 
{ 
f (wrapper->contents) ; 检查 消息 类 型 并 
return true; 调用 函数 
} 
else 
í 链 至 前 一 个 
return prev-»dispatch (msg); 调度 器 


} 
} 
public: 
TemplateDispatcher (TemplateDispatcher&& other): ` 
q(other.q),prev(other.prev),f(std::move(other.f)), 
chained (other .chained) 


{ 
} 


TemplateDispatcher (queue* q ,PreviousDispatcher* prev ,Func&& E 
q(q ),prev(prev ),f(std::forward«Func»(f )),chained(false) 
{ 


} 


template<typename OtherMsg,typename OtherFunc> 
TemplateDispatcher<TemplateDispatcher, OtherMsg, OtherFunc> 


handle (OtherFunc&& of) 
{ 
return TemplateDispatcher< 可 以 链接 附加 的 


TemplateDispatcher,OtherMsg,OtherFunc»( 处 理 函 数 
q,this,std::forward«OtherFunc» (of)); 


other.chained-true; 


prev -»chained-true; 


) 


-TemplateDispatcher() noexcept (false) " 


析 构 函数 又 是 


noexcept(false) 的 


if(!chained) 


{ 
} 


wait and dispatch(); 
1n 


TemplateDispatcher<> 类 模板 是 基于 dispatcher 类 构建 的 ， 并 且 二 者 几乎 
雷同 。 尤 其 是 析 构 函数 仍然 调用 了 wait and dispatch () 来 等 待 一 个 消息 。 

如 果 你 处 理 了 消息 ， 那 么 就 不 会 抛 出 异常 ， 所 以 你 需要 在 消息 循环 @ 中 检查 你 是 
否 真 的 处 理 了 消息 。 当 你 成 功 处 理 了 消息 时 ， 消 息 处 理 即行 停止 ， 你 就 可 以 等 待 下 一 
时 刻 的 另 一 组 消息 。 如 果 你 恰好 得 到 了 一 条 匹配 的 消息 类 型 ， 那 么 所 提供 的 函数 就 会 被 
调用 @， 而 不 是 抛 出 异常 (尽管 处 理 函 数 自身 可 能 会 抛 出 异常 )。 如 果 没 有 得 到 匹配 的 
消息 ， 那 么 就 链接 至 前 一 个 dispatcher@。 在 首 个 实例 中 ， 它 就 是 dispatcher, 
但 如 果 你 将 调用 链接 至 handle () 函数 O, 以 允许 多 种 类 型 的 消息 被 处 理 , 这 可 能 会 先 
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于 TemplateDispatcher<> 初 始 化 , 如 果 消 息 不 匹配 的 话 , 这 将 会 反 过 来 链接 到 前 一 
个 句柄 上 。 因 为 所 有 句柄 都 可 能 引发 异常 (包括 dispatcher 为 close queue 消息 
的 默认 句柄 ) ， 析 构 函数 必须 再 次 声明 为 noexcept (false) @, 

这 个 简单 的 框架 允许 你 将 任意 类 型 的 消息 压 人 队列 中 ,然后 在 接收 端 有 选择 地 匹配 
你 能 够 处 理 的 消息 。 它 同时 允许 你 为 了 压 人 消息 而 绕 过 对 队列 的 引用 ， 同 时 保持 接收 端 
的 私密 性 。 

为 了 完成 第 4 章 中 的 示例 ， 在 清单 C.6 中 给 出 了 消息 ， 清 单 C.7、 清 单 C.8 和 清单 
C.9 中 给 出 几 种 状态 机 ， 驱 动 代码 在 清单 C.10 中 给 出 。 


清单 C.6 ATM 消息 


struct withdraw 
{ 
std::string account; 
unsigned amount; 
mutable messaging::sender atm_queue; 


withdraw(std::string const& account_, 
unsigned amount_, 
messaging::sender atm_queue_): 
account (account ),amount (amount ), 
atm queue (atm queue ) 
Ü 
hi 
struct withdraw ok 
0: 
struct withdraw denied 
{}; 


struct cancel withdrawal 


{ 


std::string account; 
unsigned amount; 


cancel withdrawal (std::string const& account_, 
unsigned amount_): 
account (account ),amount (amount ) 
y 


struct withdrawal processed 


{ 
std::string account; 
unsigned amount; 


withdrawal processed(std::string const& account , 
unsigned amount ): 
account (account ),amount (amount ) 


{} 


附录 C ”消息 传递 框架 与 完整 的 ATM 示例 


struct card inserted 


{ 


std::string account; 


explicit card inserted(std::string const& account ): 
account (account ) 


{} 
ie 


struct digit_pressed 


{ 


char digit; 


explicit digit_pressed(char digit_): 
digit (digit_) 
{} 


is 

struct clear last pressed 
0: 

struct eject card 

{}i 


struct withdraw_pressed 


{ 


unsigned amount; 


explicit withdraw pressed(unsigned amount ): 
amount (amount ) 
{} 


hr 
struct cancel pressed 
{}; 


struct issue_money 


{ 
unsigned amount; 
issue_money (unsigned amount ): 
amount (amount_) 
{} 


bs 
struct verify pin 
{ 
std::string account; 
std::string pin; 
mutable messaging::sender atm queue; 


verify pin(std::string const& account ,std::string const& pin , 
messaging::sender atm queue ): 
account(account ),pin(pin ),atm queue(atm queue ) 
{} 
): 


struct pin verified 


Bi 
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Struct pin incorrect 


(7 


Struct display enter pin 


Er 


struct display_enter_card 


[i 


struct display insufficient funds 


T 


struct display withdrawal cancelled 


Qu 


struct display pin incorrect message 


{}; 


struct display withdrawal options 


{}; 


struct get_balance 


{ 


std::string account; 
mutable messaging::sender atm_queue; 


get_balance (std::string const& account ,messaging::sender atm queue ): 
account (account ),atm queue (atm queue ) 
{} 


bi 


struct balance 


{ 


unsigned amount; 


explicit balance (unsigned amount ): 
amount (amount ) 
{} 


) 


struct display balance 


{ 


unsigned amount; 


explicit display balance(unsigned amount ): 
amount (amount ) 
{} 


b 
Struct balance pressed 


OE 
清单 C.7 ATM 状态 机 


class atm 
messaging: :receiver incoming; 
messaging::sender bank; 
messaging: :sender interface hardware; 
void (atm::*state) (); 
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std::string account; 
unsigned withdrawal amount; 
std::string pin; 


void process withdrawal () 
{ 
incoming.wait () 
.handle«withdraw ok»( 
[&] (withdraw ok const& msg) 
{ 
interface hardware.send( 
issue money (withdrawal amount)); 
bank.send( 
withdrawal processed(account,withdrawal amount)); 
state=&atm: :done processing; 
) 
) 
.handle«withdraw denied»( 
[&] (withdraw denied const& msg) 
{ 
interface hardware.send(display insufficient funds()); 
State-&atm::done processing; 
) 
) 
.handle«cancel pressed»( 
[&] (cancel pressed const& msg) 
{ 
bank. send ( 
cancel withdrawal (account, withdrawal_amount) ) ; 
interface hardware.send( 
display withdrawal cancelled()); 
State-&atm::done processing; 
} 
di 
} 


void process balance() 
{ 
incoming. wait () 
.handle<balance> ( 
[&] (balance const& msg) 
{ 
interface hardware.send (display balance (msg.amount)); 
State-&atm::wait for action; 
) 
) 
.handle«cancel pressed»( 
[&] (cancel pressed const& msg) 


( 


) 
); 


State-&atm::done processing; 


) 


void wait for action() 


{ 
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interface hardware.send(display withdrawal options()); 
incoming.wait() 
.handle«withdraw pressed»( 
[&] (withdraw pressed const& msg) 
{ 
withdrawal_amount=msg.amount ; 
bank. send (withdraw (account , msg .amount , incoming) ) ; 
state=&atm: :process withdrawal; 
} 
) 
.handle«balance pressed»( 
[&] (balance pressed const& msg) 
{ 
bank.send(get balance (account, incoming) ) ; 
State-&atm::process balance; 
} 
) 
.handle«cancel pressed»( 
[&] (cancel pressed const& msg) 


( 


} 
) 


State-&atm::done processing; 


) 


void verifying pin() 
{ 
incoming. wait () 
-handle<pin_verifieds ( 
[&] (pin_verified const& msg) 


{ 


} 
) 
.handle«pin incorrect»( 
[&] (pin incorrect const& msg) 


{ 


State-&atm::wait for action; 


interface hardware.send( 
display pin incorrect message ()); 
State-&atm::done processing; 


) 
) 
.handle«cancel pressed»( 
[&] (cancel pressed const& msg) 


{ 


} 
13 


State-&atm::done processing; 


) 


void getting pin() 
{ 
incoming.wait () 
.handle«digit pressed»( 
[&] (digit pressed const& msg) 
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unsigned const pin length-4; 

pin+=msg.digit; 

if (pin. length() ==pin_length) 

{ 
bank.send(verify_pin(account,pin, incoming) ) ; 
state=é&atm: : verifying pin; 


} 
) 
.handle«clear last pressed»( 
[&] (Clear last pressed const& msg) 


{ 


if (!pin.empty () ) 


{ 
} 


pin.pop back(); 


) 
) 
.handle«cancel pressed»( 
[&] (cancel pressed const& msg) 


{ 


} 
); 


State-&atm::done processing; 


) 


void waiting for card() 
( 
interface hardware.send(display enter card()); 
incoming.wait() 
.handle«card inserted»( 
[&] (card inserted const& msg) 
{ 
account=msg.account; 
pin=""; 
interface hardware.send(display enter pin()); 
State-&atm::getting pin; 
) 
) ; 
} 


void done_processing () 

{ 
interface hardware.send(eject card()); 
State-&atm::waiting for card; 


) 


atm(atm const&) =delete; 
atm& operator=(atm const&) =delete; 


public: 
atm(messaging::sender bank_, 
messaging::sender interface hardware ): 
bank(bank ),interface hardware(interface hardware ) 


0 
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void done() 


{ 
) 


void run() 


{ 


get sender().send(messaging::close queue()); 


State-&atm::waiting for card; 
try 


{ 


foror) 


{ 
} 


(this-»*state)(); 


) 


catch(messaging::close queue const&) 
{ 
} 

} 


messaging::sender get sender() 


{ 
} 


return incoming; 


清单 C.8 银行 状态 机 


class bank machine 


messaging::receiver incoming; 
unsigned balance; 


public: 


bank machine(): 
balance (199) 


{} 


void done () 


{ 
} 


void run() 


{ 


get_sender() .send (messaging: :close_queue() ) ; 


try 
{ 
for (;;) 
{ 
incoming. wait () 
-handle<verify pin>( 
[&] (verify pin const& msg) 


{ 


if (msg. pins="193;7") 


{ 
} 


msg.atm queue.send(pin verified()); 
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else 


{ 
} 


msg.atm queue.send(pin incorrect ()); 


) 
) 
.handle«withdraw»( 
[&] (withdraw const& msg) 


( 


if (balance»smsg.amount) 


{ 


msg.atm queue.send(withdraw ok()); 
balance-2msg.amount; 


) 


else 


{ 
} 


msg.atm queue.send(withdraw denied()); 


) 
) 
.handle«get balance»( 
[&] (get balance const& msg) 


{ 


} 
) 
.handle«withdrawal processed»( 
[&] (withdrawal processed const& msg) 
{ 
} 
) 
.handle«cancel withdrawal»( 
[&] (cancel withdrawal const& msg) 


( 
) 
); 


msg.atm queue.send(::balance (balance) ) ; 


} 
} 


catch (messaging: :close_queue const&) 


{ 
} 
} 


messaging::sender get sender() 


{ 
} 


return incoming; 


}; 
清单 C.9 用 户 界面 状态 机 


class interface machine 


messaging::receiver incoming; 
public: 
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void done () 


{ 
} 


void run() 


{ 


get sender().send(messaging::close queue()); 


gry 
{ 
for(;;) 
{ 
incoming. wait () 
-handle<issue_money> ( 
[&] (issue_money const& msg) 
{ 
{ 
Std::lock guard«std::mutex» 1k(iom) ; 
std::cout<<"Issuing " 
<<msg.amount<<std::endl; 


} 
) 
-handle<display_insufficient_funds> ( 
[&] (display insufficient funds const& msg) 
( 
{ 
Std::lock guard«std::mutex» lk(iom); 
std::cout<<"Insufficient funds"<<std::endl; 


} 
) 
-handle<display_enter_pin>( 
[&] (display enter pin const& msg) 
{ 
{ 
std: :lock_guard<std::mutex> 1k(iom) ; 
std::cout 


<<"Please enter your PIN (0-9)" 
<<std::endl; 


} 
) 
-handle<display_enter_card> ( 
[&] (display enter card const& msg) 
{ 
{ 
Std::lock guard«std::mutex» 1k(iom) ; 


std::cout<<"Please enter your card (I)" 
<<std::endl; 


} 
) 
-handle<display_balance> ( 
[&] (display balance const& msg) 


{ 
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Std::lock guard«std::mutex» lk(iom); 
std::cout 
<<"The balance of your account is " 
««msg.amount««std::endl; 


) 
) 
.handle«display withdrawal options>( 
[&] (display withdrawal options const& msg) 
{ 
{ 
std::lock_guard<std::mutex> lk(iom); 
Std::cout««"Withdraw 50? (w)"««std::endl; 
std::cout<<"Display Balance? (b)" 
<<std::endl; 

std::cout<<"Cancel? (c)"<<std::endl; 


} 
) 
.handle«display withdrawal cancelled»( 
[&] (display withdrawal cancelled const& msg) 
{ 
{ 
std::lock_guard<std::mutex> 1k(iom) ; 


std::cout<<"Withdrawal cancelled" 
<<std::endl; 


} 
) 
.handle«display pin incorrect message»( 
[&] (display pin incorrect message const& msg) 
{ 
{ 
Std::lock guard«std::mutex» lk(iom); 
Std::cout««"PIN incorrect'««std::endl; 


) 
) 
.handle«eject card»( 
[&] (eject card const& msg) 
{ 
{ 
Std::lock guard«std::mutex» 1k(iom) ; 
std::cout<<"Ejecting card"<<std::endl; 


} 
i 
} 
} 
catch (messaging: :close_queue&) 
{ 
} 
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messaging::sender get sender() 


{ 


} 
y; 


清单 C.10 ”驱动 代码 


int main() 


{ 


return incoming; 


bank_machine bank; 
interface machine interface hardware; 


atm machine(bank.get sender(),interface hardware.get sender()); 


std::thread bank thread(&bank machine: : run, &bank) ; 
std::thread if thread(&interface machine::run,&interface hardware); 
std::thread atm thread(&atm::run,&machine); 


messaging::sender atmqueue (machine.get sender()); 
bool quit pressed-false; 


while(!quit pressed) 


{ 


char c=getchar() ; 


switch (c) 

{ 

case tO": 

case 81%; 

CABS) URIs 

case '3!: 

cage '4':; 

case '5': 

case '6': 

case '7': 

case '8': 

Gase vg 
atmqueue.send(digit pressed(c)); 
break; 

case 'b': 
atmqueue.send(balance pressed()); 
break; 

case 'w': 
atmqueue.send(withdraw pressed(50)); 
break; 

case "te"; 
atmqueue.send(cancel pressed()); 
break; 

cage gts 
quit pressed-true; 
break; 

case 'i': 


atmqueue.send(card inserted("acc1234")); 
break; 
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bank.done() ; 

machine .done(); 

interface hardware .done(); 
atm thread.join(); 

bank thread.join(); 

if thread.join(); 
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附录 DC++ 


01 <chrono> 头 文件 


<chrono> 头 文件 提供 了 表示 时 间 点 和 duration 的 类 , 以 及 可 作为 time_ point 源 的 
时 钟 类 。 每 个 时 钟 都 有 一 个 is steady 静态 数据 成 员 ， 能 够 指示 该 时 钟 是 否 为 一 个 按照 一 
致 的 速率 (并且 不 能 被 调整 ) 行进 的 匀速 时 钟 。stqd: :chrono: :steady_clock 类 是 唯一 
一 个 确保 匀速 的 时 钟 。 

头 文件 内 容 


namespace std 
{ 
namespace chrono 
{ 
template«typename Rep,typename Period = ratio«1»» 
class duration; 
template< 
typename Clock, 
typename Duration = typename Clock: :duration> 
class time_point; 
class system_clock; 
class steady clock; 
typedef unspecified-clock-type high resolution clock; 
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D.1.1 std::chrono::duration 类 模板 


std: :chrono: :duration 类 模板 提供 了 一 个 代表 时 间 段 的 工具 。 模 板 的 参数 Rep 和 
Period 是 用 来 存储 时 间 段 值 的 数据 类 型 , 还 有 一 个 std: : ratio 类 模板 的 实例 用 来 指示 与 
下 一 个 时 钟 周期 之 间 的 时 间 长 度 (单位 是 几 分 之 一 秒 ) 。 因 此 std::chrono:: 
duration<int，stdq::milli> 是 以 int 类 型 值 存储 的 毫秒 数 ，std: :chrono:: 
duration<short, std: :ratio<1, 50>> 是 以 short 值 类 型 存储 的 50 分 之 一 秒 的 数量 ， 
std::chrono::duration<long long, std::ration<60, 1>> 是 以 1ong long fü 


类 型 存储 的 分 钟 数 。 
类 定义 


template «class Rep, class Period-ratio«1» > 
class duration 
( 
public: 
typedef Rep rep; 
typedef Period period; 


constexpr duration() = default; 
~duration() = default; 


duration(const duration&) = default; 
duration& operator=(const duration&) = default; 


template <class Rep2> 
constexpr explicit duration(const Rep2& r); 


template <class Rep2, class Period2> 
constexpr duration(const duration<Rep2, Period2>& d); 


constexpr rep count() const; 

constexpr duration operator+() const; 
constexpr duration operator-() const; 
duration& operator++(); 

duration operator++ (int); 

duration& operator--(); 

duration operator-- (int); 

duration& operator+= (const duration& d); 
duration& operator--(const duration& d); 
duration& operator*-(const rep& rhs); 
duration& operator/-(const rep& rhs); 
duration& operator%=(const rep& rhs) ; 
duration& operator%=(const duration& rhs) ; 
static constexpr duration zero(); 

static constexpr duration min() ; 

static constexpr duration max() ; 


hi 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator== ( 
const duration<Repl, Periodl»& lhs, 
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const duration«Rep2, Period2>& rhs) ; 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator!=( 

const duration<Repl, Periodl>& lhs, 

const duration<Rep2, Period2>& rhs) ; 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator«( 


const duration<Repl, Periodl>& lhs, 
const duration<Rep2, Period2>& rhs) ; 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator«-( 

const duration«Repl, Periodl»& lhs, 

const duration<Rep2, Period2>& rhs); 


template «class Repl, class Periodl, class Rep2, class Period2» 
constexpr bool operator»( 

const duration«Repl, Periodl>& lhs, 

const duration<Rep2, Period2>& rhs); 


template «class Repl, class Periodl, class Rep2, class Period2» 
constexpr bool operator»-( 

const duration<Repl, Periodl»& lhs, 

const duration<Rep2, Period2>& rhs); 


template «class ToDuration, class Rep, class Period» 
constexpr ToDuration duration cast(const duration<Rep, Period>& d); 


需求 
Rep 必须 是 内 置 的 数值 类 型 ， 或 者 是 类 似 数字 的 用 户 定义 类 型 。Period 必须 是 


std: :ratio<> 的 一 个 实例 。 


std::chrono::duration::rep typedef 


该 typedef 定义 的 类 型 用 于 保存 duration 值 中 的 刻度 数目 。 
声明 


typedef Rep rep; 


rep 是 一 个 用 来 存放 duration 对 象 的 内 部 表示 值 的 类 型 。 
std::chrono::duration::period typedef 


Vi typedef 定义 了 一 个 std: : ratio 类 模板 实例 ， 该 实例 规定 了 时 间 段 的 计数 值 的 
单位 是 多 少 分 之 一 秒 。 例 如 ,如 果 Pperoid 是 std: :zatio<1，50> ,那么 一 个 count () 
为 的 时 间 段 值 表示 50 分 之 入 秒 。 

声明 


typedef Period period; 
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std::chrono::duration 默认 构造 函数 
用 默认 值 构 造 std: : chrono: :duration 实例 。 


声明 
constexpr duration() = default; 


结果 
duration (类 型 为 rep) 的 内 部 值 被 默认 初始 化 。 


std::chrono::duration 来 自 计 数值 的 转换 构造 函数 
用 指定 的 计数 值 构造 一 个 std: :chrono: :duration 实例 。 


= 
声明 
template «class Rep2» 
constexpr explicit duration(const Rep2& r); 


结果 

duration 对 象 的 内 部 值 被 初始 化 为 static_cast<rep>(r), 

需求 

只 有 当 Rep2 可 以 隐 式 转换 为 Rep, 并 且 Rep 是 浮 点 类 型 或 者 Rep2 不 是 浮 点 类 型 
的 时 候 ， 此 构造 函数 才 会 参与 到 重 载 方案 中 。 

后 置 条 件 


this->count () ==static_cast<rep>(r) 


std::chrono::duration 来 自 另 一 个 STD::CHRONO::DURATION 值 的 转换 构造 函数 


通过 比例 缩放 另 一 个 std: : chrono: :duration 对 象 的 计数 值 ,构造 std: : chrono: : 
duration 实例 。 

声明 
template «class Rep2, class Period2> 
constexpr duration(const duration<Rep2,Period2>& d); 


结果 

用 duration cast«duration«Rep, Period»? (d).count () 来 初始 化 duration 
对 象 的 内 部 值 。 

需求 

只 有 当 Rep 是 浮 点 类 型 ， 或 者 Rep2 不 是 一 个 浮 点 类 型 并 且 Period2 是 Peroid 
的 整数 倍 时 ( 即 ratio divide<Period2, Period>::den ==1 )， 此 构造 函数 才 
会 参与 到 重 载 方案 中 。 这 样 可 以 在 将 一 个 较 短 的 时 间 存 储 到 代表 较 长 时 间 间 隔 的 变量 


348 附录 D C++ 线程 类 库 参 考 
时 ， 避 免 意料 之 外 的 截断 (同时 导致 精度 的 损失 )。 
后 置 条 件 
this-»count()--duration cast«duration«Rep, Period»» (d) .count () 
示例 
duration<int,ratio<1,1000>> ms(5); <- 5 毫秒 错误 : 不 能 将 ms 存储 为 


duration«int,ratio«1,1»» s(ms); 整数 秒 

duration«double,ratio«1,1»» s2(ms); < 一 正确 ，s2.count==0.005 

duration«int,ratio«1,10000005» us (ms); ert 正确 ，us.count==5000 
;We 


std::chrono::count 成 员 函 数 


获取 时 间 段 值 。 
声明 


constexpr rep count() const; 
返回 
duration 对 象 的 内 部 值 ， 以 rep 类 型 表示 。 
std::chrono::duration::operator+ 一 元 加 号 运算 符 
这 其 实 没 有 运算 : 仅 返 回 *this 的 副本 。 
声明 
constexpr duration operator+() const; 
返回 
*this 
std::chrono::duration::operator- 一 元 减 号 运算 符 


返回 一 个 时 间 段 值 ， 其 count () 值 是 this->count () 的 负 值 。 
声明 


constexpr duration operator-() const; 
返回 
duration(-this-»count()); 


std::chrono::duration:operator++ 前 置 自 增 运算 符 


增加 内 部 计数 。 
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声明 

duration& operator++(); 
结果 

*-this-»internal count; 
返回 

*this 


std::chrono::duration::operator++ 后 置 自 增 运 算 符 


增加 内 部 计数 ， 并 且 返 回 增加 前 的 *this 值 。 
声明 


duration operator++ (int) ; 


结果 


duration temp(*this); 
++(*this) ; 
return temp; 


std::chrono::duration::operator-- 前 置 自 减 运算 符 
减 小 内 部 计数 。 
声明 
duration& operator--(); 
结果 
--this-»internal count; 
返回 
*this 
std::chrono::duration::operator-- 后 置 自 减 运算 符 


减 小 内 部 计数 ， 并 且 返 回 减 小 前 的 *this 值 。 
声明 

duration operator-- (int); 
结果 


duration temp (*this) ; 
--(*this); 
return temp; 
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std::chrono::duration::operator+= 复 合 赋值 运算 符 
将 男 一 个 duration 对 象 的 计数 值 加 到 *this 的 内 部 计数 值 上 。 
声明 

duration& operator«- (duration const& other); 
结果 
internal_count+=other. count () ; 
返回 
*this 
std::chrono::duration::operator-- & AIK (&3z Be 
从 *this 内 部 的 计数 值 减 去 另 一 个 duration 对 象 的 计数 值 。 
声明 
duration& operator-=(duration const& other); 
结果 
internal count--other.count(); 
返回 
*this 
std::chrono::duration::operator*- & & lit (Aja BF 
将 *this 内 部 计数 值 乘 以 给 定 的 数值 。 
声明 
duration& operator*-(rep const& rhs); 
结果 
internal count*-rhs; 
返回 
*this 
std::chrono::duration'::operator = 复合 赋值 运算 符 
将 *this 的 内 部 计数 值 除 以 给 定 的 数值 。 
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声明 
duration& operator/=(rep const& rhs); 
结果 
internal count/-rhs; 
返回 
*this 
std::chrono::duration::operator%= 复 合 赋值 运算 符 
将 *this 内 部 计数 值 设 为 其 与 给 定数 值 相 除 的 余数 。 
声明 
duration& operator%=(rep const& rhs) ; 
结果 
internal count$-rhs; 
返回 值 
*this 
std::chrono::duration::operator%= 复 合 赋值 运算 符 
将 *this 内 部 计数 值 设 为 其 与 男 一 duration 对 象 计数 值 相 除 的 余数 。 
声明 
duration& operator%=(duration const& rhs) ; 
结果 
internal count&erhs.count(); 


返回 值 


*this 
std::chrono::duration::zero 静态 成 员 函 数 


返回 一 个 表示 零 值 的 duration 对 象 。 
声明 


constexpr duration zero(); 
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返回 值 
duration (auration_ values«rep»::zero()); 
std::chrono::duration::min 静态 成 员 函 数 


返回 一 个 duration 对 象 ， 该 对 象 保存 着 给 定 实例 最 小 的 可 能 值 。 
声明 


constexpr duration min(); 
返回 值 
duration(duration values«rep»::min()); 


std::chrono::duration::max 静态 成 员 函 数 


返回 一 个 duration 对 象 ， 该 对 象 保存 着 给 定 实例 最 大 的 可 能 值 。 


声明 
constexpr duration max(); 
返回 值 


duration(duration values«rep»::max()); 


std::chrono::duration 相等 比较 运算 符 
比较 两 个 duration 对 象 是 否 相等 ， 即 便 它 们 具有 不 同 的 表现 形式 和 周期 。 


声明 


template «class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator--( 


const duration«Repl, Periodl»& lhs, 
const duration<Rep2, Period2>& rhs) ; 


需求 
每 个 1hs 必须 可 以 隐 式 地 转换 到 zhs， 反 之 亦 然 。 如 果 它 们 不 能 彼此 进行 隐 式 转 


K, 或 者 它们 是 不 同 的 duration 实例 化 结果 但 能 够 相互 隐 式 转换 , 该 表达 式 都 是 不 规 
范 的 。 


结果 
如 果 CommonDuration 是 std::common type«duration«Repl, Periodl», 


duration<Rep2, Period2>>: :type 的 同义词 ,那么 lhs==rhs 返回 CommonDuration 
(lhs) .count () ==CommonDuration (rhs) .count () 的 结果 。 
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std::chrono::duration 不 等 比较 运算 符 


比较 两 个 duration 对 象 是 否 不 相等 ， 即 便 它们 具有 不 同 的 表现 形式 和 /或 
周期 。 
声明 


template «class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator!-( 

const duration«Repl, Periodl»& lhs, 

const duration<Rep2, Period2>& rhs); 


需求 
每 个 lhs 必须 可 以 隐 式 地 转换 到 rhs， 反 之 亦 然 。 如 果 它 们 不 能 彼此 进行 隐 式 转 
换 , 或 者 它们 是 不 同 的 duration 实例 化 结果 但 能 够 相互 隐 式 转换 , 该 表达 式 都 是 不 规 
范 的 。 

返回 


! (Lhs==rhs) 


std::chrono::duration 小 于 比较 运算 符 


比较 两 个 duration HR, 看 其 中 一 个 是 否 小 于 另 一 个 , 即便 它们 具有 不 同 的 表现 
形式 和 /或 周期 。 
声明 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator«( 

const duration«Repl, Periodl»& lhs, 

const duration«Rep2, Period2>& rhs); 


需求 

每 个 lhs 必须 可 以 隐 式 地 转换 到 rhs， 反 之 亦 然 。 如 果 它 们 不 能 彼此 进行 隐 式 转 
dh, 或 者 它们 是 不 同 的 duration 实例 化 结果 但 能 够 相互 隐 式 转换 , 该 表达 式 都 是 不 规 
范 的 。 

结果 

如 果 CommonDuration 是 std::common_type<duration<Repl, Periodl», 
duration«Rep2, Period2>>::type 的 同义词 ,那么 lhs<rhs 返回 CommonDuration 
(lhs) .count () «CommonDuration (rhs) .count () 的 结果 。 


std::chrono::duration 大 于 比较 运算 符 


比较 两 个 duration 对 象 , 看 其 中 一 个 是 否 大 于 另 一 个 , 即便 它们 具有 不 同 的 表现 
形式 和 /或 周期 。 
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> 

声明 
template «class Repl, class Periodl, class Rep2, class Period2» 
constexpr bool operator»( 

const duration<Repl, Periodl»& lhs, 

const duration<Rep2, Period2>& rhs) ; 


需求 

每 个 Lhs 必须 可 以 隐 式 地 转换 到 rhs， 反 之 亦 然 。 如 果 它 们 不 能 彼此 进行 隐 式 转换 ， 
或 者 它们 是 不 同 的 duration 实例 化 结果 但 能 够 相互 隐 式 转换 ， 该 表达 式 都 是 不 规范 的 。 

返回 


rhs<lhs 


std::chrono::duration 小 于 或 等 于 比较 运算 符 


比较 两 个 duration HR, 看 其 中 一 个 是 否 小 于 或 者 等 于 另 一 个 , 即便 它们 具有 不 
同 的 表现 形式 和 /或 周期 。 
声明 


template «class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator«-( 

const duration<Repl, Periodi»& lhs, 

const duration<Rep2, Period2>& rhs); 


需求 

每 个 lhs 必须 可 以 隐 式 地 转换 到 rhs， 反 之 亦 然 。 如 果 它 们 不 能 彼此 进行 隐 式 转 
K, 或 者 它们 是 不 同 的 duration 实例 化 结果 但 能 够 相互 隐 式 转换 , 该 表达 式 都 是 不 规 
范 的 。 

返回 


! (rhs<lhs) 


std::chrono::duration 大 于 或 等 于 比较 运算 符 


比较 两 个 duration YR, 看 其 中 一 个 是 否 大 于 或 者 等 于 另 一 个 , 即便 它们 具有 不 
同 的 表现 形式 和 周期 。 

声明 
template «class Repl, class Periodl, class Rep2, class Period2» 
constexpr bool operator»-( 


const duration«Repl, Periodi»& lhs, 
const duration<Rep2, Period2>& rhs) ; 


需求 
每 个 lhs 必须 可 以 隐 式 地 转换 到 rhs， 反 之 亦 然 。 如 果 它 们 不 能 彼此 进行 隐 式 转 
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th, 或 者 它们 是 不 同 的 duration 实例 化 结果 但 能 够 相互 隐 式 转换 , 该 表达 式 都 是 不 规 
范 的 。 
返回 


! (lhs<rhs) 


std::chrono::duration_cast 非 成 员 函 数 


显 式 地 将 一 个 std: :chrono: :duration 对 象 转换 为 指定 的 std: :chrono:: 
duration 实例 。 
声明 


template <class ToDuration, class Rep, class Period> 
constexpr ToDuration duration cast (const duration<Rep, Period>& d); 


需求 
ToDuration 必须 是 std: :chrono: :duration 的 实例 。 
返回 


时 间 段 d 被 转换 为 ToDuration 所 指定 的 时 间 段 类 型 。 这 种 方法 能 够 尽量 减少 不 
同 尺度 和 表示 类 型 之 间 的 转换 所 造成 的 精度 损失 。 


D.1.2 std::chrono::time point 类 模板 


std::chrono::time point 类 模板 表示 一 个 以 特定 时 钟 来 计量 的 时 间 点 。 它 被 
指定 为 特定 时 钟 所 经 过 的 一 段 纪元 〈epoch)。 模 板 参数 Clock 指定 了 这 一 时 钟 (每 个 
不 同 的 时 钟 必须 具备 单独 的 类 型 )， 同 时 Duration 模板 参数 是 用 来 计量 经 过 时 间 的 类 
型 ， 且 必须 是 std: :chrono: :duration 类 模板 的 实例 。Duration 默认 情况 下 是 
Clock 的 默认 时 间 段 类 型 。 

类 定义 
template «class Clock,class Duration = typename Clock: :duration» 


class time point 


{ 
public: 
typedef Clock clock; 
typedef Duration duration; 
typedef typename duration::rep rep; 
typedef typename duration::period period; 


time point(); 
explicit time point(const duration& d); 


template «class Duration2» 
time point(const time point«clock, Duration2>& t); 


duration time since epoch() const; 
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time point& operator«- (const duration& d); 
time point& operator--(const duration& d); 


Static constexpr time point min(); 
Static constexpr time point max(); 


hy 


std::chrono::time_point 默认 构造 函数 
构造 一 个 time_point， 表 示 相 关联 的 Clock 的 间隔 ， 其 内 部 的 时 间 段 被 初始 化 


Jj Duration::zero(), 
声明 
time_point () ; 


后 置 条 件 
对 于 新 的 默认 构造 time point 对 象 tp, tp.time since epoch() == 


tp::duration::zero(), 
Std::chrono::time point 时 间 段 构造 函数 
构造 time_point， 表 示 其 相关 联 的 Clock 的 间隔 为 指定 的 时 间 段 。 


声明 
explicit time point(const duration& d); 

后 置 条 件 

对 于 time point WR tp, ， 以 表示 时 间 段 d 的 tp(d) 进行 构造 ， 
tp.time since epoch() == d, 


std::chrono::time point 转换 构造 函数 


从 另 一 个 具有 相同 Clock 但 不 同 的 Duration 的 time point 对 象 ,来 构造 一 个 
time point 对 象 。 

声明 
template «class Duration2> 
time point(const time point«clock, Duration2>& t); 


需求 

Duration2 必须 能 够 隐 式 地 转换 为 Duration, 

结果 

例如 time point(t.time since epoch()), t.time since epoch() 的 返 
回 值 被 隐 式 转换 为 Duration 类 型 的 对 象 ， 且 该 值 被 存储 在 新 构造 的 time_point 对 
象 中 。 
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std::chrono::time point::time since epoch 成 员 函 数 
获取 特定 time point 对 象 的 时 钟 间隔 时 间 段 。 
声明 
duration time since epoch() const; 
返回 
*this 中 存储 的 duration f. 
std::chrono::time_point::operator+= 复 合 赋值 运算 符 
将 指定 的 duration 加 到 指定 的 time_point 对 象 所 存储 的 值 上 。 
声明 
time point& operator+= (const duration& d); 


结果 
将 a 加 到 *this 内 部 的 duration WRE, Pid: 


this-»internal duration += d; 
返回 
*this 
std::chrono::time point::operator-7 & & lit (Bia FF 
将 指定 的 time_point 对 象 中 存储 的 值 中 减 去 指定 的 duration, 


声明 
time point& operator-=(const duration& d); 

结果 

从 *this 内 部 的 duration HARRE d, PAn: 
this-»internal duration -= d; 

返回 
*this 


std::chrono::time point::min 静态 成 员 函 数 


得 到 一 个 代表 其 类 型 的 最 小 可 能 值 的 time. point 对 象 。 
声明 


static constexpr time point min(); 
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返回 


time point(time point::duration::min()) 
td::chrono::time_point::max 静态 成 员 函 数 
得 到 一 个 代表 其 类 型 的 最 大 可 能 值 的 time point MR, 


= 
FAA 
static constexpr time point max(); 
返回 


time point(time point::duration::max()) 


D.1.3 std::chrono::system clock 类 


std: :chrono::system clock 类 提供 了 从 系统 真实 时 间 获 取 当 前 挂钟 时 间 的 方法 。 
当前 时 间 可 以 通过 调用 std: : chrono: :System clock: :now() 来 获得 ,std: :chrono:: 
system clock::time point 的 实例 可 以 通过 std::chrono::system clock:: 
to time t() 和 std::chrono::system clock::to time point() 函数 ， 而 与 
time t 相互 转换 。 系 统 时 钟 不 是 匀速 的 ， 所 以 之 后 对 std::chrono::system_ 
clock: :now () 的 调用 ， 可 能 会 返回 比 之 前 的 调用 更 早 的 时 间 〈 比 如， 操作 系统 的 时 钟 被 手 
动 调整 过 或 是 与 外 部 时 钟 进行 了 同步 ) 。 

类 定义 
class system clock 
{ 
public: 

typedef unspecified-integral-type rep; 

typedef std::ratio<unspecified, unspecified> period; 

typedef std::chrono::duration<rep,period> duration; 

typedef std::chrono::time_point<system_clock> time point; 

static const bool is steady-unspecified; 


static time_point now() noexcept; 


static time t to time t(const time point& t) noexcept; 
static time point from time t(time t t) noexcept; 


) 
std::chrono::system_clock::rep typedef 


某 个 整数 类 型 的 类 型 别名 ， 用 来 存储 duration 值 中 的 刻度 数量 。 


声明 


typedef unspecified-integral-type rep; 


D.1 <chrono> 头 文件 359 


std::chrono::system clock::periodtypedef 


X std::ratio 类 模板 实例 的 类 型 别名 ， 用 来 指定 在 两 个 duration 或 
time point 间 最 小 的 秒 数 (或 几 分 之 一 秒 ) period 指定 了 时 钟 的 精度 ， 而 非 其 步 
进 频率 。 


声明 


typedef std::ratio«unspecified,unspecified» period; 


Std::chrono::system clock::durationtypedef 


std::chrono::duration 类 模板 的 实例 ， 它 能 够 保存 由 系统 范围 实时 时 钟 所 返 
回 的 任意 两 个 时 间 点 的 差 值 。 
声 阴 


typedef std::chrono::duration« 
std::chrono::system_clock: :rep, 
std::chrono::system clock::period» duration; 


std::chrono::system clock::time pointtypedef 


std::chrono::time point 类 模板 的 实例 , 它 能 够 保存 由 系统 范围 实时 时 钟 返 
回 的 时 间 点 。 
声明 


typedef std::chrono::time point«std::chrono::system clock» time point; 


std::chrono::system clock::now 静态 成 员 函 数 
从 系统 范围 实时 时 钟 获取 当前 的 挂钟 时 间 。 
声明 
time point now() noexcept; 
返回 
代表 当前 系统 范围 实时 时 钟 的 当前 时 间 的 time point, 
引发 
如 果 发 生 错 误 ， 引 发 std: :system error 类 型 的 异常 。 


std::chrono::system_clock::to_time_t 静态 成 员 函 数 


将 time point 实例 转换 到 time t, 
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声明 
time t to time t(time point const& t) noexcept; 
返回 
表示 与 + 相同 时 间 点 的 time tf, t 会 被 进位 或 截取 至 秒 的 精度 。 
引发 
如 果 发 生 错误 ， 引 发 std: :system_error 类 型 的 异常 。 


std::chrono::system_clock::from_time_t 静态 成 员 函 数 


将 time t 实例 转换 到 上 time point, 
声明 
time point from time t(time t const& t) noexcept; 
返回 
代表 与 上 相同 时 间 点 的 time_Point 值 。 
引发 
如 果 发 生 错误 ， 引 发 std: :system_error 类 型 的 异常 。 


D.1.4 std::chrono::steady_clock 类 


std::chrono::steady clock 类 提供 了 对 系统 范围 匀速 时 钟 的 访问 。 当 前 时 间 
可 以 :通过 调用  std::chrono::steady clock::now() 来 获取 。， 在 
std::chrono::steady clock::now() 和 挂钟 时 间 之 间 并 没有 固定 的 关系 。 匀 速 的 
时 钟 不 能 往 回 走 ， 所 以 如 果 一 个 对 std::chrono::steady clock: :now() 的 调用 
在 男 一 个 对 它 的 调用 之 前 ， 那 么 第 二 个 调用 必须 返回 与 第 一 个 相同 或 比 它 更 晚 的 时 间 
点 。 此 时 钟 以 统一 的 速率 ， 尽 可 能 久 地 前 进 。 

类 定义 


class steady clock 
{ 
public: 
typedef unspecified-integral-type rep; 
typedef std::ratio« 
unspecified,unspecified» period; 
typedef std::chrono::duration«rep,period» duration; 
typedef std::chrono::time point«steady clock» 
time point; 
Static const bool is steady-true; 


static time point now() noexcept; 


D.1 <chrono> 头 文件 361 


std::chrono::steady clock::rep typedef 
某 个 整数 类 型 的 类 型 别名 ， 用 来 存储 duration 值 中 的 刻度 数量 。 
声明 
typedef unspecified-integral-type rep; 
std::chrono::steady_clock::period typedef 
X std: : ratio 类 模板 实例 的 类 型 别名 ,用 来 指定 在 两 个 dauration Ey time point 


间 最 小 的 秒 数 (或 几 分 之 一 秒 )。period 指定 了 时 钟 的 精度 ， 而 非 其 步 进 频率 。 
声明 


typedef std::ratio<unspecified, unspecified> period; 
std::chrono::steady_clock::duration typedef 
std::chrono::duration 类 模板 的 实例 ， 它 能 够 保存 由 系统 范围 匀速 的 时 钟 所 
返回 的 任意 两 个 时 间 点 的 差 值 。 
声明 


typedef std::chrono::duration« 
std::chrono::steady clock::rep, 
std::chrono::steady clock::period» duration; 
std::chrono::steady clock::time pointtypedef 
std::chrono::time point 类 模板 的 实例 ， 它 能 够 保存 由 系统 范围 匀速 的 时 钟 
返回 的 时 间 点 。 
声明 


typedef std::chrono::time point«std::chrono::steady clock» time point; 
std::chrono::steady_clock::now 静态 成 员 函 数 
从 系统 范围 匀速 的 时 钟 获取 当前 的 时 间 。 


声明 
time point now() noexcept; 
返回 
代表 当前 系统 范围 匀速 时 钟 的 当前 时 间 的 time_point。 
引发 


如 果 发 生 错 误 ， 引 发 std::system error 类 型 的 异常 。 
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同步 
如 果 一 个 对 std:;chrono::steady clock::now () 的 调用 发 生 在 另 一 个 之 前 ， 
那么 第 一 个 调用 所 返回 的 time point 必须 小 于 或 等 于 第 二 个 调用 所 返回 的 值 。 


D.1.5 std::chrono::high resolution clock typedef 


0.2 


std::chrono::high resolution clock 类 以 高 精度 提供 了 对 系统 范围 时 钟 
的 访问 。 对 于 所 有 的 时 钟 ， 当 前 时 间 可 以 通过 调用 std: :chrono: :high_ 
resolution clock: :now() 来 获取 。std: :chrono: :high resolution clock 
可 以 是 std::chrono::system clock 类 或 者 是 std::chrono: :steady clock 
类 的 typedef， 或 者 它 可 以 是 单独 的 类 型 。 

尽管 std: :chrono: :high resolution clock 具有 所 有 库 中 提供 的 时 钟 的 最 
高 精度 ，std::chrono: :high resolution clock: :now () 仍然 会 占用 一 定 的 时 
间 量 。 在 对 短 操 作 进 行 计时 的 时 候 你 必须 小 心 的 评估 对 std::chrono::high. 
resolution clock: :now() 调 用 的 开销 。 

类 定义 
class high resolution clock 


{ 
public: 
typedef unspecified-integral-type rep; 
typedef std::ratio« 
unspecified,unspecified» period; 
typedef std::chrono::duration«rep,period» duration; 


typedef std::chrono::time point« 
unspecified» time point; 
Static const bool is steady-unspecified; 


static time point now() noexcept; 


«condition variable» 3k x £t 


«condition variable> 头 文件 提供 了 条 件 变量 。 这 些 都 是 基本 级 别 的 同步 机 
制 ， 可 以 允许 一 个 线程 阻塞 直到 某 些 条 件 为 真 或 者 经 过 了 超时 期 限 。 
头 文件 内 容 


namespace std 


enum class cv status { timeout, no timeout ); 


class condition variable; 
class condition variable any; 


) 
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D.2.1 std::condition variable 类 


std::condition variable 类 人 允许 线程 等 待 一 个 条 件 变 为 true, 
std::condition variable 的 实例 ,不 是 CopyRAssignable、CopyConstructible、 


MoveAssignable fll MoveConstructible 的 。 
类 定义 

class condition variable 

{ 

public: 


condition variable(); 
-condition variable (); 


condition variable(condition variable const& ) = delete; 
condition variable& operator-(condition variable const& ) - delete; 


void notify one() noexcept; 
void notify all() noexcept; 


void wait(std::unique lock«std::mutex»& lock); 


template «typename Predicate» 
void wait(std::unique lock«std::mutex»& lock,Predicate pred); 


template «typename Clock, typename Duration» 
cv status wait until( 
std: :unique lock«std::mutex»& lock, 
const std::chrono::time point«Clock, Duration»& absolute time); 


template «typename Clock, typename Duration, typename Predicate» 
bool wait until( 
std::unique lock«std::mutex»& lock, 
const std::chrono::time point«Clock, Duration»& absolute time, 
Predicate pred); 
template «typename Rep, typename Period» 
cv status wait for( 
std::unique lock«std::mutex»& lock, 
const std::chrono::duration<Rep, Period»& relative time); 


template «typename Rep, typename Period, typename Predicate» 
bool wait for( 
std::unique lock«std::mutex»& lock, 
const std::chrono::duration<Rep, Period»& relative time, 
Predicate pred); 


s 


void notify all at thread exit(condition variable&,unique lock«mutex-»); 
std::condition variable 默认 构造 函数 
构造 std::condition variable WR, 
声明 


condition variable(); 
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结果 

构造 一 个 新 的 std::condition variable 实例 。 

引发 

如 果 条 件 变量 无 法 构造 ， 抛 出 std::system_error 类 型 的 异常 。 


std::condition variable 析 构 函数 


销毁 std::condition variable WR, 
声明 
-condition variable(); 
前 置 条 件 
在 对 wait () .wait for() 和 wait_until() 的 调用 中 , 没有 线程 被 阻塞 在 rthis E, 
结果 
销毁 *this。 
引发 
Z5. 


std::condition variable::notify one 成 员 函 数 


唤醒 当前 在 std: : condition variable 上 等 待 的 其 中 一 条 线程 。 

声明 
void notify one() noexcept; 

结果 

在 调用 处 ， 唤 醒 在 *this 上 等 待 的 其 中 一 条 线程 。 如 果 没 有 线程 等 待 着 ， 此 调用 没 
有 任何 效果 。 

引发 

如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异常 。 

同步 

在 单一 std: :condition variable 实例 上 对 notify one(), notify all(), 
wait() 、wait for() 和 wait until() 的 调用 会 被 序列 化 。 对 notify one() 或 
notify all O 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::condition variable::notify all KA mA 


唤醒 当前 在 std::condition variable 上 等 待 的 全 部 线程 。 
声明 


void notify all() noexcept; 
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结果 

在 调用 处 , 唤醒 在 *this 上 等 待 的 所 有 线程 。 如 果 没 有 线程 等 待 着 ， 此 调用 没有 任 
何 效果 。 

引发 

如 果 无 法 得 到 结果 ， 引 发 std::system error 异常 。 

同步 

在 单一 std::condition variable 实例 上 对 notify one(), notify 
all(), wait(), wait for() 和 wait_until() 的 调用 会 被 序列 化 。 对 notify 
one () 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::condition variable::wait 成 员 函 数 


一 直 等 待 ， 直 到 std::condition variable 通过 调用 notify one(), 
notify_all1() 或 伪 唤 醒 而 被 唤醒 。 


声明 

void wait(std::unique lock«std::mutex»& lock); 
前 置 条 件 
lock.owns lock() 为 真 ， 且 该 锁 为 调用 线程 所 拥有 。 
结果 


原子 级 解锁 所 提供 的 lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调用 
notify one(), notify all O 而 唤醒 ， 或 是 线程 自己 伪 唤 醒 。 在 对 wait () 的 调用 
返回 之 前 ，lock 对 象 被 再 次 锁定 。 

引发 

如 果 无 法 得 到 结果 ， 引 发 std::system error HH, WR lock 对 象 在 调用 
wait () 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 

注 ” 伪 唤醒 的 意思 是 调用 wait) 的 线程 可 能 在 没有 线程 调用 过 notify one 0 X 
notify all() 的 情况 下 唤醒 。 因 此 建议 如 果 可 能 的 话 ， 首 选 接受 断言 的 wait () ER 
版 本 。 否 则 ， 建 议 在 一 个 测试 与 条 件 变量 关联 的 断言 的 循环 中 来 调用 wait () 。 
同步 
在 单一 std::condition variable 实例 上 对 notify one(), notify 

all(), wait(), wait for() 和 wait_until() 的 调用 会 被 序列 化 。 对 notify 

one () 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 
std::condition_variable::wait 成 员 函 数 之 接受 断言 的 重 载 版 本 


一 直 等 待 ， 直 到 std::condition variable 通过 调用 notify one () 、 
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notify _all() 而 被 唤醒 ， 且 断言 为 true。 
声明 


template<typename Predicate> 
void wait (std::unique_lock<std::mutex>& lock, Predicate pred) ; 


前 置 条 件 

表达 式 pred O 必须 有 效 ， 且 其 返回 的 可 转换 为 bool.lock. owns lock() 的 值 
必须 为 trzue， 且 该 锁 必须 被 调用 wait O 的 线程 所 拥有 。 

结果 

类 似 于 
while(!pred()) 

wait (lock) ; 
} 

引发 

因 调 用 pred 所 引发 的 所 有 蜡 常 ， 或 者 如 果 无 法 得 到 结果 ， 引 发 std: :system_ 
error 异常 。 


注 潜在 的 伪 唤 醒 的 意思 是 无 法 确定 pred 会 被 调用 多 少 次 。Pred 总 是 被 lock 锁定 的 互 斥 

元 调用 ， 而 且 当 CHAR) (bool)pred() 返 回 true 时 该 函数 才 会 返回 

同步 

在 单一  std::condition variable 3E fij E Xj notify one() , 
notify all(), wait(), wait for() 和 wait_until() 的 调用 会 被 序列 化 。 对 
notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::condition_variable::wait for 成 员 函 数 


一 直 等 待 ， 直 到 std::condition variable 通过 调用 notify one() 、 
notify_all () 或 伪 唤 醒 而 被 唤醒 ， 或 者 直到 一 个 指定 的 时 间 有 段 逝去 或 线程 被 伪 唤醒 。 
声明 


template<typename Rep,typename Period> 
cv status wait for( 
Std::unique lock«std::mutex»& lock, 
std: :chrono: :duration<Rep, Period> const& relative time); 


前 置 条 件 

lock.owns lock () 为 真 ， 且 该 锁 为 调用 线程 所 拥有 。 

结果 

原子 级 解锁 所 提供 的 lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调用 
notify one(), 、notify_all() 而 唤醒 ， 或 者 relative time 指定 的 时 间 段 逝去 ， 
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或 是 线程 自己 伪 唤醒 。 在 对 wait for O 的 调用 返回 之 前 ，1ock 对 象 被 再 次 锁定 。 
引发 
如 果 无 法 得 到 结果 ， 引 发 std::system error 异常 。 如 果 lock 对 象 在 调用 
wait () 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 


注 伪 唤 醒 的 意思 是 调用 wait_for() 的 线程 可 能 在 没有 线程 调用 过 notify_one 0 X 
notify all() 的 情况 下 唤醒 。 因 此 建议 如 果 可 能 的 话 ， 首 选 接受 断言 的 
wait_for() 重 载 版 本 。 否 则 ， 建 议 在 一 个 测试 与 条 件 变量 关联 的 断言 的 循环 中 来 
调用 wait_for() 。 当 做 此 工作 来 确保 超时 仍然 有 效 的 时 候 必 须 注意 ， 
wait_until() 在 多 数 场合 下 可 能 会 更 合适 , 线程 可 能 会 比 指定 的 时 间 段 阻塞 更 久 ， 
如 果 可 能 ， 逝 去 的 时 间 应 决定 于 匀速 时 钟 。 
同步 
在 单一 std::condition variable 实例 上 对 notify one() , 

notify all(), wait(), wait for() 和 wait until O 的 调用 会 被 序列 化 。 对 

notify one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::condition variable::wait for 成 员 函 数 之 接受 断言 的 重 载 版 本 


—HS, 直到 std::condition variable 通过 调用 notify_one() 、 
notify_all() 且 断言 为 true， 或 者 直到 一 个 指定 的 时 间 段 逝去 。 
声明 


template<typename Rep,typename Period,typename Predicate> 
bool wait for( 
Std::unique lock«std::mutex»& lock, 
std::chrono::duration<Rep, Period> const& relative time, 
Predicate pred); 


前 置 条 件 

RER pred () 必须 有 效 ， 且 其 返回 的 可 转换 为 bool.lock.owns lock () 的 值 
必须 为 true， 且 该 锁 必须 被 调用 wait for O 的 线程 所 拥有 。 

结果 

类 似 于 


internal clock::time point end-internal clock::now()*relative time; 
while(!pred()) 
{ 
std::chrono: :duration<Rep, Period> remaining time- 
end-internal_clock: :now() ; 
if(wait for(lock,remaining time)--std::cv status: :timeout) 
return pred(); 
) 


return true; 
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返回 
如 果 对 pred () 最 近 的 调用 返回 true， 则 返回 true, wR relative time 
指定 的 时 间 间 隔 逝 去 且 pred () 返回 false， 则 返回 false, 


注 潜在 的 伪 唤 醒 的 意思 是 无 法 确定 pred 会 被 调用 多 少 次 。 Pred 总 是 被 lock 锁定 的 互 斥 
TWAA, MEH (HRY) (boo1)pred () 返回 true 或 者 relative time 指定 的 时 
闻 段 逝去 时 该 函数 才 会 返回 。 线 程 可 能 会 比 指定 的 时 间 段 阻塞 更 久 。 如 果 可 能 ， 逝 去 的 时 
间 应 决定 于 匀速 时 钟 。 


引发 

因 调 用 pred 所 引发 的 所 有 异常 ， 或 者 如 果 无 法 得 到 结果 ， 引 发 
std::system error 异常 。 

同步 

在 单一 std::condition variable 实例 上 对 notify one(), notify 
all()、wait()、wait_for() 和 wait until() 的 调用 会 被 序列 化 。 对 ,notify_ 
one () 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


Std::condition variable::wait until 成 员 函 数 


一 直 等 待 ， 直 到 std::condition variable 通过 调用 notify one(), 
notify all () 或 伪 唤 醒 而 被 唤醒 ， 或 者 达到 一 个 指定 的 时 间 ， 或 线程 被 伪 唤 醒 。 
声明 
template«typename Clock,typename Duration» 
cv status wait until( 


Std::unique lock«std::mutex»& lock, 
std::chrono::time point«Clock,Duration» const& absolute time); 


前 置 条 件 

lock.owns lock () 为 真 ， 且 该 锁 为 调用 线程 所 拥有 。 

结果 

原子 地 解锁 所 提供 的 lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调用 
notify one(), notify all() 而 唤醒 ， 或 者 Clock::now () 返回 了 一 个 等 于 或 晚 
于 absolute time 的 时 间 ， 或 是 线程 自己 伪 唤 醒 。 在 对 wait until () 的 调用 返回 
ZB, lock 对 象 被 再 次 锁定 。 

返回 

如 果 线 程 被 notify one() IÈ notify all O 的 调用 唤醒 或 者 伪 唤 醒 ， 返 回 
Std::cv status::no timeout, 否则 返回 std::cv status::timeout, 

引发 

如 果 无 法 得 到 结果 ， 引 发 std::system error 异常 。 如 果 lock 对 象 在 调用 
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wait O 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 


XO 伪 唤 醒 的 意思 是 调用 wait_until() 的 线程 可 能 在 没有 线程 调用 过 notify_one() 或 
notify all() 的 情况 下 唤醒 , 因此 建议 如 果 可 能 的 话 , 首选 接受 断言 的 wait_until () 
重 载 版 本 。 否则 ， 建 议 在 一 个 测试 与 条 件 变量 关联 的 断言 的 循环 中 来 调用 
wait until() 。 没 有 保证 说 调用 线程 会 被 阻塞 多 久 ， 只 有 当 函 数 返 回 false, H 
Clock: :now () 返回 的 时 间 等 于 或 晚 于 absolute time 的 时 间 点 , 线程 才 会 解除 阻塞 ， 


同步 

在 单一 std: :condition variable 实例 上 对 notify one(), notify 
all(, wait(), wait for() 和 wait until O 的 调用 会 被 序列 化 。 对 notify_ 
one () 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::condition variable::wait until 成 员 函 数 之 接受 断言 的 重 载 版 本 


一 直 等 待 ， 直 到 std::condition variable 通过 调用 notify one() 、 
notify all() 且 断言 为 true， 或 者 达到 直到 一 个 指定 的 时 间 。 
声明 


template<typename Clock,typename Duration,typename Predicate> 
bool wait_until ( 
std: :unique_lock<std: :mutex>& lock, 
std::chrono: :time_point<Clock,Duration> const& absolute_time, 
Predicate pred) ; 


前 置 条 件 

表达 式 pred O 必须 有 效 ， 且 其 返回 的 可 转换 为 bool .lock.owns_lock() 的 值 
必须 为 true， 且 该 锁 必须 被 调用 wait until O 的 线程 所 拥有 。 

结果 

类 似 于 


while(!pred()) 


( 


if (wait until(lock,absolute time)--std::cv status::timeout) 
return pred(); 


) 


return true; 

返回 

如 果 对 pred O 最 近 的 调用 返回 true, NRE true, WRH relative time 
指定 的 时 间 间 隔 逝 去 且 pred 0 返回 false, MRE false, 


+ 洪 在 的 伪 唤 醒 的 意思 是 无 法 确定 pred 会 被 调用 多 少 次 。pred 总 是 被 lock 锁定 的 互 斥 
元 调用 ， 而 且 当 ( 且 仅 当 ) (bool)pred() 返回 true 或 者 Clock: :now() 返回 一 个 等 
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TA T absolute time 的 时 间 ， 函 数 才 会 返回 。 没 有 保证 说 调用 线程 会 被 阻塞 多 扩 ， 
只 有 当 函 数 返回 false, H Clock: :now() 返回 的 时 间 等 于 或 晚 于 absolute time 的 
时 间 点 ， 线 程 才 会 解除 阻塞 。 


引发 

Av pred 所 引发 的 所 有 异常 ,或 者 如 果 无 法 得 到 结果 ， 引 发 
std: :system error 异常 。 

同步 

Æ HA —  std::condition variable 实例 上 对 notify one() , 
notify all(), wait(), wait for()f wait until O 的 调用 会 被 序列 化 。 对 
notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::notify all at thread exit 非 成 员 函 数 
在 当前 线程 退出 时 ， 唤 醒 所 有 等 待 std: :condition variable 的 线程 。 


= 
声明 
void notify all at thread exit( 
condition variable& cv,unique lock«mutex» lk); 


前 置 条 件 

lk.owns_lock() 为 true,， 并 且 该 锁 被 调用 线程 持 有 。1lk.mutex O 应 该 返回 相 
同 的 值 ， 作 为 任意 提供 给 wait () 、wait_for () 或 wait_until() 的 锁 对 象 ， 在 来 自 
当前 等 待 线程 的 cv 上 。 

结果 

将 Ik 持 有 的 锁 的 所 有 权 转 移 给 内 部 存储 ， 并 且 计 划 当 调用 线程 退出 时 通知 cv。 此 
通知 应 该 类 似 于 : 


lk.unlock(); 
cv.notify all(); 


引发 
如 果 无 法 达成 该 结果 ， 引 发 std:system error 异常 。 


注 锁 会 一 直 持 有 到 线程 退出 ， 所 以 必须 小 心 避免 死 锁 。 建 议 调用 线程 应 尽早 退出 ， 并 且 在 该 
线程 上 不 要 进行 阻塞 操作 . 


用 户 应 该 确保 等 待 线 程 不 会 在 被 唤醒 的 时 候 错 误 地 假设 线程 已 退出 ,尤其 有 潜在 的 
伪 唤 醒 时 。 要 达到 这 一 目的 ， 可 以 在 等 待 线 程 上 测试 一 个 只 会 做 出 true 的 断言 ， 在 互 
斥 元 的 保护 下 通知 线程 , 且 不 在 调用 notify all at thread exit 之 前 释放 互 斥 元 
上 的 锁 。 
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D.2.2 std::condition_variable_any 类 


std::condition variable 类 人 允许 线程 等 待 一 个 条 件 变 为 true 。 这 里 
std::condition variable 只 能 与 std::unique_lock<std: :mutex> 一 起 使 用 ， 
std::condition variable any 可 以 与 任意 符合 Lockable 需求 的 类 型 一 起 使 用 。 

std::condition variable any 的 实例 ， 不 是 CopyAssignable 、 
CopyConstructible, MoveAssignable 和 MoveConstructible 的 。 

类 定义 
class condition variable any 


{ 

public: 
condition variable any(); 
-condition variable any(); 


condition variable any( 


condition variable any const& ) - delete; 
condition variable any& operator-( 
condition variable any const& ) - delete; 


void notify one() noexcept; 
void notify all() noexcept; 


template<typename Lockable> 
void wait (Lockable& lock) ; 


template <typename Lockable, typename Predicate> 
void wait (Lockable& lock, Predicate pred); 


template <typename Lockable, typename Clock,typename Duration> 
std::cv_status wait until( 

Lockable& lock, 

const std::chrono::time point«Clock, Duration»& absolute time); 


template « 
typename Lockable, typename Clock, 
typename Duration, typename Predicate» 
bool wait until( 
Lockable& lock, 
const std::chrono::time point«Clock, Duration»& absolute time, 
Predicate pred); 


template «typename Lockable, typename Rep, typename Period» 
Std::cv status wait for( 
Lockable& lock, 
const std::chrono::duration«Rep, Period»& relative time); 
template « 
typename Lockable, typename Rep, 
typename Period, typename Predicate» 
bool wait for( 
Lockable& lock, 
const std::chrono::duration<Rep, Period>& relative time, 
Predicate pred); 
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std::condition variable any 默认 构造 函数 


构造 std: :condition variable any 对象 。 
声明 
condition variable any(); 
结果 
构造 一 个 新 的 std::condition variable any 实例 。 
引发 
如 果 条 件 变量 无 法 构造 ， 引 发 std: :system_error 类 型 的 异常 。 


std::condition variable any 析 构 函数 


销毁 std: :condition variable any 对 象 。 

声明 
-condition variable any(); 

前 置 条 件 

在 对 wait(), wait for() fü wait_until() 的 调用 中 ， 没 有 线程 被 阻塞 在 
*this E, 

结果 

销 般 *this。 

引发 

无 。 


std::condition_variable_any::notify_one KARA 


唤醒 当前 在 std::condition variable any 上 等 待 的 其 中 一 条 线程 。 

声明 
void notify one() noexcept; 

结果 

在 调用 处 , 唤醒 在 *this 上 等 待 的 其 中 以 一 条 线程 。 如 果 没 有 线程 等 待 着 ， 此 调用 
没有 任何 效果 。 

引发 

如 果 无 法 得 到 结果 ， 引 发 std::system error 异常 。 

同步 

在 单一 std::condition variable any 实例 上 X] notify one(), 
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notify all(), wait(), wait for() 和 wait until() 的 调用 会 被 序列 化 。 对 
notify one()E notify all() 的 调用 ,只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::condition_variable_any::notify all 成 员 函 数 


唤醒 当前 在 std: :condition variable any 上 等 待 的 全 部 线程 。 
声明 
void notify all() noexcept; 


结果 

在 调用 处 , 唤醒 在 *this 上 等 待 的 所 有 线程 。 如 果 没 有 线程 等 待 着 ， 此 调用 没有 任 
何 效 果 。 

引发 

如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异常 。 

同步 

在 单一 std::condition variable any 实例 上 对 notify_one() , 
notify all(), wait(), wait for() 和 wait until() 的 调用 会 被 序列 化 。 对 
notify_one () 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::condition variable any::wait 成 员 函 数 


一 直 等 待 ， 直 到 std::condition variable any 通过 调用 notify_one()、 
notify all() 而 被 唤醒 或 伪 唤 醒 。 

声明 
template<typename Lockable> 
void wait(Lockable& lock); 


前 置 条 件 

Lockable 满足 Lockable 需求 ， 且 lock WEM. 

结果 

原子 级 解锁 所 提供 的 lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调用 
notify one(), notify all() 而 唤醒 ， 或 是 线程 自己 伪 唤 醒 。 在 对 wait O 的 调用 
返回 之 前 ，lock 对 象 被 再 次 锁定 。 

引发 

如 果 无 法 得 到 结果 ， 引 发 std::system error FH, MR lock 对 象 在 调用 
wait() 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 


注 ” 伪 唤醒 的 意思 是 调用 wait) 的 线程 可 能 在 没有 线程 调用 过 notify_one() 或 
notify all O 的 情况 下 唤醒 。 因 此 建议 如 果 可 能 的 话 ， 首 选 接受 断言 的 wait () 重 载 版 
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本 。 否 则 ， 建 议 在 一 个 测试 与 条 件 变 量 关联 的 断言 的 循环 中 来 调用 wait () 。 

同步 

在 单一 std::condition variable any 实例 上 对 notify one() 、 
notify all(), wait(), wait for() 和 wait_until() 的 调用 会 被 序列 化 。 对 
notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::condition variable any::wait 成 员 函 数 之 接受 断言 的 重 载 版 本 


一 直 等 待 ， 直 到 std: :condition variable any 通过 调用 notify one(), 
notify all(O 而 被 唤醒 ， 且 断言 为 true。 

声明 
template<typename Lockable,typename Predicate> 
void wait (Lockable& lock, Predicate pred) ; 


前 置 条 件 

表达 式 pred () 必须 有 效 ， 且 其 返回 的 可 转换 为 Dool .1lock.owns lock () 的 值 
必须 为 true, Lockable 满足 Lockable fbk, H lock 拥有 锁 。 

结果 

类 似 于 


while(!pred()) 


wait (lock); 


引发 
因 调 用 pred 所 引发 的 所 有 异常 ， 或 者 如 果 无 法 得 到 结果 ， 引 发 


std: :system error 异常 。 


注 潜在 的 伪 唤 桓 的 意思 是 无 法 确定 pred 会 被 调用 多 少 次 。pred 总 是 被 lock 锁定 的 互 斥 

THA, m EX HE) (bool) pred() RH true 时 该 函数 才 会 返回 。 

同步 

在 单一 std: :condition variable any 实例 上 对 notify one(), notify 
all(), wait(), wait for()cil wait_until() 的 调用 会 被 序列 化 。 对 notify 
one () 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::condition variable any::wait for 成 员 函 数 


一 直 等 待 ， 直 到 std::condition variable 通过 调用 notify one(), 
notify_all() 或 伪 唤 醒 而 被 唤醒 ， 或 者 直到 一 个 指定 的 时 间 段 逝去 或 线程 被 伪 唤 醒 。 
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=> 

声明 
template<typename Lockable,typename Rep, typename Period> 
std::cv_status wait for( 

Lockable& lock, 

std::chrono::duration<Rep, Period> const& relative time); 


前 置 条 件 

Lockable 满足 Lockable 需求 ， 且 lock 拥有 锁 。 

结果 

原子 级 解锁 所 提供 的 lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调用 
notify one(), notify all() 而 唤醒 ， 或 者 relative time 指定 的 时 间 段 逝去 ， 
或 是 线程 自己 伪 唤 醒 。 在 对 wait for () 的 调用 返回 之 前 ，lock 对 象 被 再 次 锁定 。 

引发 

如 果 无 法 得 到 结果 ， 引 发 std::system error 异常 。 如 果 lock 对 象 在 调用 
wait O 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 


注 ” 伪 唤醒 的 意思 是 调用 wait for () 的 线程 可 能 在 没有 线程 调用 过 notify one 0 X 
notify_all() 的 情况 下 唤醒 。 因 此 建议 如 果 可 能 的 话 ， 首 选 接受 断言 的 wait_for () 
重 载 版 本 。 否 则 ， 建 议 在 一 个 测试 与 条 件 变 量 关联 的 断言 的 循环 中 来 调用 wait_for(), 
当做 此 工作 来 确保 超时 仍然 有 效 的 时 候 必 须 注意 ; wait_until() 在 多 数 场合 下 可 能 会 更 
合适 。 线 程 可 能 会 比 指定 的 时 间 段 阻塞 更 久 。 如 果 可 能 ， 逝 去 的 时 间 应 决定 于 匀速 时 钟 。 
同步 
在 单一 std::condition variable any 实例 上 Xt notify one() , 
notify all(), wait(), wait for() 和 wait until() 的 调用 会 被 序列 化 。 对 
notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::condition variable any::wait for 成 员 函 数 之 接受 断言 的 重 载 版 本 


一 直 等 待 ， 直 到 std::condition variable any 通过 调用 notify one () 、 
notify_all() 且 断言 为 tzue， 或 者 直到 一 个 指定 的 时 间 段 逝去 。 
声明 


template<typename Lockable,typename Rep, 
typename Period, typename Predicate> 
bool wait_for ( 
Lockable& lock, 
std::chrono::duration<Rep, Period> const& relative_time, 
Predicate pred) ; 


前 置 条 件 
表达 式 pred () 必须 有 效 ， 且 其 返回 的 可 转换 为 bool.lock, Lockable 满足 
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Lockable 需求 ， 且 lock 拥有 锁 。 
结果 
类 似 于 


internal clock::time point end-internal clock::now()*relative time; 
while(!pred()) 


{ 
std::chrono: :duration<Rep, Period> remaining time- 
end-internal_clock: :now() ; 
if (wait_for (lock, remaining_time) ==std::cv_status: :timeout) 
return pred() ; 


} 


return true; 

返回 

如 果 对 pred () 最 近 的 调用 返回 true， 则 返回 true, 如 果 由 relative time 
指定 的 时 间 间 隔 逝 去 且 Pred() 返回 false， 则 返回 false, 


注 潜在 的 伪 唤 醒 的 意思 是 无 法 确定 pred 会 被 调用 多 少 次 。Pred MER lock 锁定 的 互 斥 

THA, WEY (HRY) (bool)pred O 返回 true 或 者 relative time 指定 的 时 

闻 段 逝去 时 该 函数 才 会 返回 。 线 程 可 能 会 比 指定 的 时 间 段 阻塞 更 久 。 如 果 可 能 ， 逝 去 的 时 

闻 应 决定 于 匀速 时 钟 。 

引发 

因 调用 pred 所 引发 的 所 有 异常 ,或 者 如 果 无 法 得 到 结果 ,引发 std: : system_error 
异常 。 

同步 

fr Hi — std::condition variable any 实例 上 对 notify one() 、 
notify all(), wait(), wait_for()# wait_until() 的 调用 会 被 序列 化 。 对 
notify_one () 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


std::condition variable::wait until 成 员 函 数 


一 直 等 待 ， 直 到 std::condition variable 通过 调用 notify one(), 
notify_all1() 或 伪 唤 醒 而 被 唤醒 ， 或 者 达到 一 个 指定 的 时 间 ， 或 线程 被 伪 唤 醒 。 
声明 


template<typename Lockable,typename Clock,typename Duration» 
Std::cv status wait until( 

Lockable& lock, 

Std::chrono::time point«Clock,Duration» const& absolute time); 


前 置 条 件 
lock.owns_lock() 为 真 ， 且 该 锁 为 调用 线程 所 拥有 。 
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结果 

原子 级 解锁 所 提供 的 Lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调用 
notify one(), notify all() 而 唤醒 ， 或 者 Clock: :now() 返回 了 一 个 等 于 或 晚 
T absolute time 的 时 间 ， 或 是 线程 自己 伪 唤 醒 。 在 对 wait until () 的 调用 返回 
ZA, Lock 对 象 被 再 次 锁定 。 

返回 

如 果 线 程 被 notify_one () 或 notify_all() 的 调用 唤醒 或 者 伪 唤 醒 ， 返 回 
std::cv status::no timeout, 否则 返回 std::cv status::timeout, 

引发 

如 果 无 法 得 到 结果 ， 引 发 std::system error 异常 。 如 果 lock 对 象 在 调用 
wait O 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 


注 ” 伪 唤醒 的 意思 是 调用 wait() 的 线程 可 能 在 没有 线程 调用 过 notify_one() 或 

notify all O 的 情况 下 唤醒 。 因此 建议 如 果 可 能 的 话 ， 首 选 接受 断言 的 wait () 重 载 版 

本 。 否 则 ， 建 议 在 一 个 测试 与 条 件 变量 关联 的 断言 的 循环 中 来 调用 wait_until()。 没 

有 保证 说 调用 线程 会 被 阻塞 多 久 ， 只 有 当 函 数 返 回 false, H Clock: :now() 返回 的 时 

间 等 于 或 晚 于 absolute_time 的 时 间 点 ， 线 程 才 会 解除 阻塞 

同步 

在 单一 std::condition variable any 实例 上 对 notify one(), 
notify all(), wait(), wait for() 和 wait until() 的 调用 会 被 序列 化 。 
对 notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 
的 线程 。 


std::condition variable::wait until 成 员 函 数 之 接受 断言 的 重 载 版 本 


一 直 等 待 ， 直 到 std::condition variable 通过 调用 notify one()、 
notify_all() 且 断言 为 true,， 或 者 直到 达到 一 个 指定 的 时 间 。 
声明 


template«typename Lockable,typename Clock, 
typename Duration, typename Predicate» 
bool wait until( 
Lockable& lock, 
std: :chrono: :time point«Clock,Duration» const& absolute time, 
Predicate pred); 


前 置 条 件 
KER pred () 必须 有 效 ， 且 其 返回 的 可 转换 为 bool.lock.owns_lock () 的 值 
必须 为 true， 且 该 锁 必 须 被 调用 wait () 的 线程 所 拥有 。 
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结果 
类 似 于 


while(!pred()) 


{ 
if (wait until (lock, absolute_time) ==std::cv_status: :timeout) 
return pred(); 
) 


return true; 

返回 

如 果 对 pred () 最 近 的 调用 返回 true, MRE true， 如 果 由 relative time 
指定 的 时 间 间 隔 逝 去 且 pred () 返回 false， 则 返回 false, 


注 潜在 的 伪 唤 醒 的 意思 是 无 法 确定 pred 会 被 调用 多 少 次 。Pred 总 是 被 1ock 锁定 的 互 斥 
THA, WEH (HIH) (bool)pred() 返 回 true 或 者 Clock: :now() 返 回 一 个 等 
于 或 晚 于 absolute time 的 时 间 ， 函 数 才 会 返回 。 没 有 保证 说 调用 线程 会 被 阻塞 多 久 ， 
RA 4 BRA false, 且 Clock::now() 返 回 的 时 间 等 于 或 晚 于 absolute time 的 
时 间 点 ， 线 程 才 会 解除 阻塞 。 


引发 

因 调 用 pred 所 引发 的 所 有 蜡 常 ， 或 者 如 果 无 法 得 到 结果 ， 引 发 
std::system error 异常 。 

同步 

在 单一 std::condition variable any 实例 上 对 notify one() 、 
notify all(), wait(), wait for() 和 wait_until() 的 调用 会 被 序列 化 。 对 
notify_one() 或 notify all() 的 调用 , 只 会 唤醒 在 该 调用 之 前 就 开始 等 待 的 线程 。 


<atomic> 头 文件 


<atomic> 头 文件 提供 了 一 组 基本 的 原子 类 型 以 及 对 这 些 类 型 的 操作 ， 还 有 一 个 类 
模板 ， 用 来 构造 满足 一 些 条 件 的 用 户 定义 类 型 的 原子 版 本 。 
头 文件 内 容 


#define ATOMIC BOOL LOCK FREE see description 
#define ATOMIC CHAR LOCK FREE see description 
#define ATOMIC SHORT LOCK FREE see description 
#define ATOMIC INT LOCK FREE see description 
#define ATOMIC LONG LOCK FREE see description 
#define ATOMIC LLONG LOCK FREE see description 
define ATOMIC CHAR16 T LOCK FREE see description 
#define ATOMIC CHAR32 T LOCK FREE see description 
#define ATOMIC WCHAR T LOCK FREE see description 
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#define ATOMIC POINTER LOCK FREE see description 


#define ATOMIC VAR INIT(value) see description 


namespace std 


{ 


enum memory_order; 


struct atomic_flag; 


typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
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atomic_bool; 
atomic_char; 
atomic charl6 t; 
atomic char32 t; 
atomic schar; 
atomic uchar; 
atomic short; 
atomic ushort; 
atomic int; 
atomic uint; 
atomic long; 
atomic ulong; 
atomic llong; 
atomic ullong; 
atomic wchar t; 


atomic int least8 t; 

atomic uint least8 t; 
atomic int leastl16 t; 
atomic uint least16 t; 


atomic int least32 t; 
atomic uint least32 t; 
atomic int least64 t; 
atomic uint least64 t; 
atomic int fast8 t; 
atomic uint fast8 t; 
atomic int fastl6 t; 
atomic uint fastl6 t; 
atomic int fast32 t; 
atomic uint fast32 t; 
atomic int fast64 t; 
atomic uint fast64 t; 
atomic int8 t; 

atomic uint8 t; 
atomic int16 t; 
atomic uintl6 t; 
atomic int32 t; 
atomic uint32 t; 
atomic int64 t; 
atomic uint64 t; 
atomic intptr t; 
atomic uintptr t; 
atomic size t; 

atomic ssize t; 
atomic ptrdiff t; 
atomic intmax t; 
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typedef see description atomic uintmax t; 


template«typename T» 
struct atomic; 


extern "C" void atomic thread fence (memory order order); 
extern "C" void atomic signal fence (memory order order); 


template«typename T» 
T kill dependency(T); 


D.3.1 std::atomic xxx typedef 


为 了 向 下 兼容 C 标准 ,提供 了 原子 整 型 的 typedef. 这 既是 对 相应 std: :atomic<T> 
特 化 的 typedef， 也 是 具有 相同 接口 特 化 的 基 类 。 


std::atomic char std::atomic<char> 


std::atomic_schar std::atomic<signed char> 
std::atomic_uchar std::atomic«unsigned char» 
std::atomic short std::atomic<short> 
std::atomic_ushort std::atomic<unsigned short> 
std::atomic_int std::atomic<int> 
std::atomic_uint std::atomic<unsigned int> 
std::atomic_long std::atomic<long> 
std::atomic_ulong std::atomic<unsigned long> 
std::atomic_llong std::atomic<long long> 
std::atomic_ullong std::atomic<unsigned long long> 
std::atomic_wchar_t std::atomic<wchar_t> 
std::atomic_char16_t std::atomic<char16_t> 
std::atomic_char32_t std::atomic<char32_t> 


D.3.2 ATOMIC_xxx_LOCK_FREE Æ 


这 些 宏 确 定 了 对 应 特定 内 置 类 型 的 源 自 类 型 是 不 是 无 锁 的 。 
宏 声 明 


#define ATOMIC BOOL LOCK FREE see description 
#define ATOMIC CHAR LOCK FREE see description 
#define ATOMIC SHORT LOCK FREE see description 
#define ATOMIC INT LOCK FREE see description 
#define ATOMIC LONG LOCK FREE see description 
#define ATOMIC LLONG LOCK FREE see description 
#define ATOMIC CHAR16 T LOCK FREE see description 
#define ATOMIC CHAR32 T LOCK FREE see description 
#define ATOMIC WCHAR T LOCK FREE see description 
#define ATOMIC POINTER LOCK FREE see description 
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ATOMIC xxx LOCK FREE 的 值 是 0、1 或 2。 值 0 表示 该 操作 对 于 提名 类 型 对 应 的 
有 符号 和 无 符号 原子 类 型 从 来 都 不 是 无 锁 的 , 值 1 表示 该 操作 对 于 那些 类 型 在 特定 场合 
下 可 能 是 无 锁 的 ， 而 其 他 场合 则 不 是 ， 值 2 表示 该 操作 始终 是 无 锁 的 。 例 如 ， 如 果 
ATOMIC INT LOCK FREE 是 2, std: :atomic<int> 和 std: :atomic<unsigned> 
上 的 操作 始终 是 无 锁 的 。 

ATOMIC POINTER LOCK FREE 宏 描述 了 在 原子 指针 特 化 std: :atomic«T*» E 
的 操作 的 无 锁 属 性 。 


D.3.3 ATOMIC VAR INIT 宏 
ATOMIC VAR INIT 宏 提 供 了 将 原子 变量 初始 化 至 特定 值 的 方法 。 
声明 
#define ATOMIC VAR INIT(value) see description 


这 个 宏 展 开 至 令 牌 序列 ， 能 够 以 下 面 的 形式 ， 用 来 在 表达 式 里 使 用 指定 值 初始 化 标 
准 原子 类 型 . 


std::atomic<type> x = ATOMIC VAR_INIT(val); 


指定 的 值 必须 与 对 应 于 原子 类 型 的 非 原子 类 型 相 兼容 ， 例 如 : 


std::atomic«int» i = ATOMIC VAR INIT (42); 
std::string s; 
std: :atomicestd::string*> p = ATOMIC_VAR_INIT(&s) ; 


这 样 的 初始 化 不 是 原子 的 ， 并 且 任 何 通过 其 他 线程 访问 即将 初始 化 的 变量 时 ， 初 始 
化 没有 发 生 于 访问 之 前 就 会 产生 数据 竞争 而 且 是 未 定义 的 行为 。 


D.3.4 std::memory_order 枚 举 


std::memory order 枚 举 用 来 指定 原子 操作 的 排序 约束 。 
声明 


typedef enum memory order 
memory order relaxed,memory order consume, 
memory order acquire,memory order release, 


memory order acq rel,memory order seq cst 
} memory order; 


标记 有 这 些 内 存 顺序 值 的 操作 表现 如 下 (参见 第 5 章 )。 
std::memory order relaxed 


此 操作 不 会 提供 任何 额外 的 排序 约束 。 


382 


附录 D “C++ 线程 类 库 参 考 


std::memory_order_release 


此 操作 是 在 指定 内 存 地 点 的 释放 操作 。 它 因此 在 与 一 个 读 取 存储 值 相同 内 存 地 点 的 
获取 操作 同步 。 


std::memory order acquire 


此 操作 是 在 指定 内 存 地 点 的 获取 操作 。 如 果 存 储 的 值 被 一 个 释放 操作 所 写 ， 则 该 存 
储 与 此 操作 同步 。 


std::memory order acq rel 


此 操作 必须 是 读 -修改 - 写 操 作 ， 并 且 在 指定 地 点 同时 表现 为 std: :memory_ 


order acquire 和 std: :memory order release, 


std::memory_order_seq_ cst 


此 操作 构成 顺序 一 致 操作 的 一 个 全 局 总 体 排序 的 一 部 分 。 另 外 ， 如 果 这 是 个 存储 ， 
ERMA std::memory order release 操作， 如 果 这 是 个 载 人 ， 它 表现 为 
std::memory order acquire 操作 ， 如 果 它 是 读 -修改 - 写 操作 ， 它 同时 表现 为 
std::memory order acquire fllstd::memory order release, 这 是 所 有 操作 
的 默认 值 。 


std::memory_order_consume 


此 操作 是 在 指定 的 内 存 位 置 的 消费 操作 。 


D.3.5 std::atomic thread fence 函数 


std::atomic thread fence () 在 代码 中 插入 一 个 “内 存 障 碍 ”或 是 "Bi", 
以 便 在 操作 之 间 强 制 内 存 顺 序 约束 。 

声明 
extern "C" void atomic thread fence (std: :memory order order); 


结果 

插入 一 个 带 有 所 需 内 存 顺 序 约束 的 屏障 。 

带 有 std: :memory order release, std: :memory order acq rel W 
std::memory order seq cst 的 order 的 屏障 ， 与 相同 内 存 地 址 上 的 获取 操作 同 
步 ， 如 果 该 获取 操作 读 取 一 个 由 屏障 后 面 原子 操作 存储 的 值 在 相同 的 线程 上 。 

释放 操作 与 带 有 std::memory order acquire , std: :memory order 
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acq rel BK std::memory order seq cst fy order 的 屏障 同步 ,如果 该 释放 操作 
存储 一 个 被 屏障 前 的 原子 操作 读 取 的 值 。 

引发 

无 。 


D.3.6 std::atomic signal fence 函数 


std::atomic signal fence () 函数 在 代码 中 插 和 人 一 个 内 存 障 碍 或 屏障 ， 以 便 
在 线程 上 的 操作 和 线程 上 信号 句柄 中 的 操作 之 间 强 制 内 存 顺 序 约束 

声明 
extern "C" void atomic signal fence(std::memory order order); 


结果 

插入 一 个 带 有 所 需 内 存 顺序 约束 的 屏障 。 等 效 于 std::atomic thread. 
fence(order), ， 除 了 此 约束 只 应 用 在 线程 和 同一 线程 上 的 信号 句柄 之 间 。 

引发 

无 。 


D.3.7 std::atomic flag 类 


std::atomic flag 类 提供 了 原子 flag 的 简单 骨架 。 这 是 C++11 标准 唯一 保证 为 
无 锁 的 数据 类 型 (尽管 很 多 原子 类 型 在 大 多 数 实现 中 也 是 无 锁 的 )。 

std::atomic flag 的 实例 要 么 是 set HAE cear, 

类 定义 
struct atomic flag 
! atomic_flag() noexcept = default; 

atomic_flag(const atomic_flag&) = delete; 


atomic_flag& operator= (const atomic_flag&) = delete; 
atomic_flag& operator= (const atomic_flag&) volatile = delete; 


bool test_and_set (memory_order = memory_order_seq_cst) volatile 
noexcept ; 

bool test and set(memory order = memory order seq cst) noexcept; 
void clear(memory order - memory order seq cst) volatile noexcept 
void clear(memory order - memory order seq cst) noexcept; 


jui 


bool atomic flag test and set(volatile atomic flag*) noexcept; 
bool atomic flag test and set(atomic flag*) noexcept; 
bool atomic flag test and set explicit( 

volatile atomic flag*, memory order) noexcept; 
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bool atomic flag test and set explicit( 

atomic flag*, memory order) noexcept; 
void atomic flag clear(volatile atomic flag*) noexcept; 
void atomic flag clear(atomic flag*) noexcept; 
void atomic flag clear explicit( 

volatile atomic flag*, memory order) noexcept; 
void atomic flag clear explicit( 

atomic flag*, memory order) noexcept; 


#define ATOMIC FLAG INIT unspecified 


std::atomic flag 默认 构造 函数 


默认 构造 的 std::atomic flag 实例 是 clear 还 是 set 是 未 指定 的 。 对 于 静态 存储 
时 限 的 对 象 ， 初 始 化 应 该 是 静态 初始 化 。 

声明 
Std::atomic flag() noexcept = default; 

结果 

构造 在 未 指定 的 状态 的 新 的 std::atomic flag 对 象 。 

引发 

X. 


std::atomic flag 使 用 atomic flag init 初始 化 
std::atomic flag 的 实例 可 以 使 用 ATOMIC FLAG INIT 宏 来 初始 化 ， 这 
种 情况 下 它 会 初始 化 为 clear 状态 。 对 于 静态 存储 时 限 的 对 象 ， 初 始 化 应 该 是 静态 
初始 化 。 
声明 
#define ATOMIC FLAG INIT unspecified 
用 法 
Std::atomic flag flag-ATOMIC FLAG INIT; 
结果 
构造 在 clear 状态 的 新 的 std: :atomic flag 对 象 。 
引发 
ot 
std::atomic_flag::test_and set KA BR 


原子 级 设置 fag， 并 检查 它 是 不 是 已 设置 。 


385 
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声明 
bool test and set(memory order order = memory order seq cst) volatile 


noexcept; 
bool test and set(memory order order - memory order seq cst) noexcept; 


结果 

设置 flag。 

返回 

如 果 flag 在 调用 处 是 已 设置 的 ， 返 回 true, WR flag 是 清除 的 ， 返 回 false, 
引发 

X. 


注 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 的 读 -修改 - 写 操作 。 


std::atomic flag test and set 非 成 员 函 数 


设置 flag， 并 检查 它 是 不 是 已 设置 。 
声明 


bool atomic flag test and set(volatile atomic flag* flag) noexcept; 
bool atomic flag test and set (atomic flag* flag) noexcept; 


结果 


return flag-»test and set(); 


std::atomic flag test and set explicit 非 成 员 函 数 


设置 flag， 并 检查 它 是 不 是 已 设置 。 
声明 


bool atomic flag test and set explicit( 
volatile atomic flag* flag, memory order order) noexcept; 


bool atomic flag test and set explicit( 
atomic flag* flag, memory order order) noexcept; 


返回 


return flag-»test and set (order); 


std::atomic flag::clear 成 员 函 数 
清除 flag。 


= 
声明 
void clear(memory order order = memory order seq cst) volatile noexcept; 


void clear(memory order order - memory order seq cst) noexcept; 
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前 置 条 件 
提供 的 order 必须 是 std: :memory order relaxed, std: :memory order _ 


release Hj std::memory order seq cst 其 中 之 一 。 
结果 
清除 flag。 
引发 
X. 


注 这 是 对 包括 *this 的 内 存 地 址 的 原子 存储 操作 ， 


Std::atomic flag clear 非 成 员 函 数 


清除 flag。 
声明 


void atomic flag clear(volatile atomic flag* flag) noexcept; 
void atomic flag clear(atomic flag* flag) noexcept; 


结果 


flag-»clear(); 
std::atomic flag clear explicit 非 成 员 函 数 


清除 flag。 
声明 


void atomic flag clear explicit( 
volatile atomic flag* flag, memory order order) noexcept; 


void atomic flag clear explicit( 
atomic flag* flag, memory order order) noexcept; 


结果 


return flag-»clear (order); 


D.3.8 std::atomic 类 模板 


std: :atomic 类 模板 提供 了 一 个 带 有 原子 操作 的 封装 器 ， 可 以 用 于 任意 符合 下 面 
需求 的 类 型 。 

模板 参数 BaseType 必须 具备 如 下 特点 。 

Wb 有 平凡 的 默认 构造 函数 。 

W ”有 平凡 的 拷贝 赋值 运算 符 。 
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图 有 平凡 的 析 构 函数 。 

W ”可 以 进行 按 位 相等 比较 。 

这 基本 上 意味 着 std: :atomic<some-built-in-type> 是 正确 的 ， 正 如 
std::atomic<some-simple-struct>, 但 像 std: :atomic<std: :string> 这 样 
的 就 不 行 了 。 

在 主 模板 之 外 , 还 有 为 内 置 整 型 而 设 的 特 化 , 和 提供 类 似 x++ 这 样 额外 操作 的 指针 。 


std::atomic 的 实例 不 是 CopyConstructible 和 CopyAssignable 的 ， 因 
为 这 些 操作 都 不 能 作为 一 个 单一 原子 操作 来 进行 。 
类 定义 
template<typename BaseType» 
struct atomic 
{ 
atomic() noexcept = default; 
constexpr atomic(BaseType) noexcept; 


BaseType operator-(BaseType) volatile noexcept; 
BaseType operator- (BaseType) noexcept; 


atomic(const atomic&) = delete; 
atomic& operator-(const atomic&) = delete; 
atomic& operator-(const atomic&) volatile - delete; 


bool is lock free() const volatile noexcept; 
bool is lock free() const noexcept; 
void store(BaseType,memory order - memory order seq cst) 
volatile noexcept; 
void store(BaseType,memory order - memory order seq cst) noexcept; 
BaseType load(memory order - memory order seq cst) 
const volatile noexcept; 
BaseType load(memory order = memory order seq cst) const noexcept; 
BaseType exchange (BaseType,memory order = memory order seq cst) 
volatile noexcept; 
BaseType exchange (BaseType,memory order = memory order seq cst) 
noexcept; 


bool compare exchange strong( 

BaseType & old value, BaseType new value, 

memory order order - memory order seq cst) volatile noexcept; 
bool compare exchange strong( 

BaseType & old value, BaseType new value, 

memory order order - memory order seq cst) noexcept; 
bool compare exchange strong( 

BaseType & old value, BaseType new value, 

memory order success order, 

memory order failure order) volatile noexcept; 
bool compare exchange strong( 

BaseType & old value, BaseType new value, 

memory order success order, 

memory order failure order) noexcept; 
bool compare exchange weak( 

BaseType & old value, BaseType new value, 
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memory order order = memory order seq cst) 
volatile noexcept; 
bool compare exchange weak( 
BaseType & old value, BaseType new value, 
memory order order - memory order seq cst) noexcept; 
bool compare exchange weak( 
BaseType & old value, BaseType new value, 
memory order success order, 
memory order failure order) volatile noexcept; 
bool compare exchange weak( 
BaseType & old value, BaseType new value, 
memory order success order, 
memory order failure order) noexcept; 


operator BaseType () const volatile noexcept; 
operator BaseType () const noexcept; 
i 
template<typename BaseType» 
bool atomic is lock free(volatile const atomic«BaseType»*) noexcept; 
template«typename BaseType» 
bool atomic is lock free(const atomic<BaseType>*) noexcept; 
template«typename BaseType> 
void atomic init(volatile atomic«BaseType»*, void*) noexcept ; 
template<typename BaseType> 
void atomic_init (atomic<BaseType>*, void*) noexcept ; 
template<typename BaseType> 
BaseType atomic_exchange (volatile atomic<BaseType>*, memory order) 
noexcept ; 
template<typename BaseType> 
BaseType atomic exchange (atomic<BaseType>*, memory order) noexcept; 
template«typename BaseType> 
BaseType atomic exchange explicit( 
volatile atomic«BaseType»*, memory order) noexcept; 
template«typename BaseType» 
BaseType atomic exchange explicit( 
atomic«BaseType»*, memory order) noexcept; 
template«typename BaseType» 
void atomic store(volatile atomic<BaseType>*, BaseType) noexcept; 
template«typename BaseType» 
void atomic store(atomic«BaseType»*, BaseType) noexcept; 
template<typename BaseType> 
void atomic_store_explicit ( 
volatile atomic<BaseType>*, BaseType, memory order) noexcept; 
template<typename BaseType> 
void atomic_store_explicit ( 
atomic<BaseType>*, BaseType, memory order) noexcept; 
template<typename BaseType> 
BaseType atomic_load(volatile const atomic<BaseType>*) noexcept; 
template<typename BaseType> 
BaseType atomic_load(const atomic<BaseType>*) noexcept; 
template<typename BaseType> 
BaseType atomic_load_explicit ( 
volatile const atomic<BaseType>*, memory_order) noexcept; 
template<typename BaseType> 
BaseType atomic load explicit ( 
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const atomic«BaseType»*, memory order) noexcept; 

template<typename BaseType> 

bool atomic compare exchange strong( 
volatile atomic<BaseType>*,BaseType * old value, 
BaseType new value) noexcept; 

template<typename BaseType» 

bool atomic compare exchange strong( 
atomic«BaseType»*,BaseType * old value, 
BaseType new value) noexcept; 

template<typename BaseType> 

bool atomic compare exchange strong explicit ( 
volatile atomic<BaseType>*,BaseType * old value, 
BaseType new value, memory order success order, 
memory order failure order) noexcept; 


template<typename BaseType> 

bool atomic_compare_exchange_strong_explicit ( 
atomic<BaseType>*,BaseType * old value, 
BaseType new_value, memory_order success_order, 
memory_order failure_order) noexcept; 

template<typename BaseType> 

bool atomic_compare_exchange_weak ( 
volatile atomic<BaseType>*,BaseType * old_value,BaseType new_value) 
noexcept ; 

template<typename BaseType> 

bool atomic_compare_exchange_weak ( 
atomic<BaseType>*,BaseType * old_value,BaseType new_value) noexcept; 

template<typename BaseType> 

bool atomic_compare_exchange_weak_explicit ( 
volatile atomic<BaseType>*,BaseType * old value, 
BaseType new value, memory order success order, 
memory order failure order) noexcept; 

template<typename BaseType> 

bool atomic_compare_exchange_weak_explicit ( 
atomic<BaseType>*,BaseType * old_value, 
BaseType new value, memory order success order, 
memory order failure order) noexcept; 


注 尽管 这 些 非 成 员 函 数 被 指定 为 模板 ， 它 们 可 以 作为 函数 的 重 载 集 来 提供 ， 且 不 应 该 使 用 模 
板 参数 的 显 式 特 化 。 


std::atomic 默认 构造 函数 
使 用 默认 初始 化 值 构造 std: :atomic 的 实例 。 
声明 


atomic() noexcept; 


结果 
使 用 默认 初始 化 值 构造 一 个 新 的 std::atomic 的 实例 。 对 于 静态 存储 时 限 的 对 
象 ， 初 始 化 应 该 是 静态 初始 化 。 
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注 使 用 默认 构造 函数 初始 化 的 带 有 非 静态 存储 时 限 的 std: :atomic 实例 , 不 能 指望 它 拥有 
一 个 可 预见 的 值 。 


引发 
Jo. 


std::atomic int 非 成 员 函 数 


在 std::atomic<BaseType> 的 实例 中 非 原子 级 存储 给 定 的 值 。 
声明 


template<typename BaseType> 

void atomic init (atomic<BaseType> volatile* p, BaseType v) noexcept; 
template<typename BaseType> 

void atomic_init (atomic<BaseType>* p, BaseType v) noexcept; 


结果 
非 原子 级 将 v 的 值 存储 在 *p 中 。 在 一 个 尚未 默认 构造 的 或 是 在 构造 后 已 进行 过 任 
何 操作 的 atomic<BaseType> 实 例 上 调用 atomic init () ， 都 是 未 定义 的 行为 。 


注 由 于 该 存储 是 非 原子 的 ， 所 有 来 自 于 另 一 线程 的 对 了 所 指向 的 对 象 的 并 发 访问 (即便 是 原 
TUN) 均 构 成 数据 竞争 。 


引发 
355 


std::atomic 转换 构造 函数 


用 给 定 的 BaseType 值 构造 std: :atomic 实例 。 
声明 
constexpr atomic(BaseType b) noexcept; 
结果 
JH o 的 值 构造 新 的 std: :atomic 对 象 对 于 静态 存储 时 限 的 对 象 这 是 静态 初始 化 。 
引发 
Io. 


std::atomic 转换 赋值 运算 符 


在 *this 中 存储 一 个 新 的 值 。 
声明 


BaseType operator=(BaseType b) volatile noexcept; 
BaseType operator- (BaseType b) noexcept; 
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结果 


return this-»store (b); 


std::atomic::is lock free 成 员 函 数 


确定 在 *this 上 的 操作 是 无 锁 的 。 
声明 


bool is lock free() const volatile noexcept; 
bool is lock free() const noexcept; 


返回 
如 果 在 *this 上 的 操作 是 无 锁 的 ， 返 回 true, 否则 false, 
引发 
3b. 
std::atomic::is lock free 非 成 员 函 数 
确定 在 *this 上 的 操作 是 无 锁 的 。 
声明 


template<typename BaseType> 
bool atomic is lock free(volatile const atomic<BaseType>* p) noexcept; 


template<typename BaseType> 
bool atomic is lock free(const atomic<BaseType>* p) noexcept; 


结果 


return p-»is lock free(); 


std::atomic::load 成 员 函 数 


原子 级 载 人 std: :atomic 实例 的 当前 值 。 
声明 
BaseType load(memory order order 


const volatile noexcept; 
BaseType load(memory order order - memory order seq cst) const noexcept; 


HERH 

提供 的 order 必须 是 std::memory order relaxed, std: :memory_order_ 
release Hj std::memory order seq cst 其 中 之 一 。 

结果 

原子 级 载 人 存储 在 *this 中 的 值 。 


memory order seq cst) 


LS 
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返回 

在 调用 时 *this 中 存储 的 值 。 
引发 

Ke 


注 这 是 对 包括 *this 的 内 存 地 址 的 原子 载 入 操作 。 


std::atomic load 非 成 员 函 数 


原子 级 载 人 std: :atomic 实例 的 当前 值 。 
声明 


template<typename BaseType> 

BaseType atomic_load(volatile const atomic<BaseType>* p) noexcept; 
template<typename BaseType> 

BaseType atomic_load(const atomic<BaseType>* p) noexcept; 


结果 


return p-»1load(); 


std::atomic load 3E Fk P iE t 


原子 级 载 人 std: atomic 实例 的 当前 值 。 
声明 


template<typename BaseType> 
BaseType atomic_load_explicit ( 

volatile const atomic<BaseType>* p, memory order order) noexcept ; 
template«typename BaseType> 
BaseType atomic load explicit( 

const atomic«BaseType»* p, memory order order) noexcept; 


结果 


return p->load (order); 


std::atomic::operator 基 类 型 转换 运算 符 


载 人 存储 在 *this 中 的 值 。 
声明 


operator BaseType() const volatile noexcept; 
operator BaseType() const noexcept; 


结果 


return this->load(); 
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std::atomic::store 成 员 函 数 


在 atomic<BaseType> 实 例 中 存储 一 个 新 值 。 
声明 

void store(BaseType new value,memory order order = memory order seq cst) 
volatile noexcept; 


void store(BaseType new value,memory order order - memory order seq cst) 
noexcept; 


前 置 条 件 

提供 的 order 必须 是 std::memory order relaxed, std::memory 
order release mk std::memory order seq cst 其 中 之 一 。 

结果 

在 *this 中 存储 new value, 

引发 

35. 


注 这 是 对 包括 *this 的 内 存 地 址 的 原子 存储 操作 ， 


std::atomic store 非 成 员 函 数 


在 atomic<BaseType> 实 例 中 存储 一 个 新 值 。 
声明 


template<typename BaseType> 

void atomic_store(volatile atomic<BaseType>* p, BaseType new_value) 
noexcept ; 

template<typename BaseType> 

void atomic store(atomic«BaseType»* p, BaseType new value) noexcept; 


结果 
p->store (new_value) ; 
std::atomic store explicit 非 成 员 函 数 
在 atomic<BaseType> 实 例 中 存储 一 个 新 值 。 


声明 

template<typename BaseType> 

void atomic_store_explicit ( 
volatile atomic<BaseType>* p, BaseType new_value, memory_order order) 
noexcept ; 

template<typename BaseType> 


void atomic_store_explicit ( 
atomic<BaseType>* p, BaseType new value, memory order order) noexcept; 
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结果 


p-»store(new value,order); 


std::atomic::exchange 成 员 函 数 


存储 一 个 新 值 并 读 取 旧 值 。 
声明 

BaseType exchange( 
BaseType new value, 


memory order order - memory order seq cst) 
volatile noexcept; 


结果 

在 *this 中 存储 new_value， 并 且 获 取现 存 的 x*this fi, 
返回 

在 刚刚 存储 之 前 的 *this 值 。 

引发 

35. 


ik 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 的 读 -修改 - 写 操作 。 
std::atomic exchange 非 成 员 函 数 
在 atomic<BaseType> 实 例 中 存储 一 个 新 的 值 并 且 读 取 之 前 的 值 。 


-ir 
丙 明 

template<typename BaseType> 

BaseType atomic exchange (volatile atomic<BaseType>* p, BaseType new_value) 
noexcept; 

template<typename BaseType» 


BaseType atomic exchange (atomic<BaseType>* p, BaseType new value) noexcept ; 
结果 


return p-»exchange (new value); 
std::atomic exchange explicit 3E A% 53 EE 287 
在 atomic<BaseType> 实 例 中 存储 一 个 新 的 值 并 且 读 取 之 前 的 值 。 


k 

声明 
template<typename BaseType> 
BaseType atomic_exchange_explicit ( 


volatile atomic<BaseType>* p, BaseType new_value, memory_order order) 
noexcept ; 
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template<typename BaseType> 
BaseType atomic_exchange_explicit ( 
atomic<BaseType>* p, BaseType new value, memory order order) noexcept; 


结果 


return p-»exchange (new value,order); 


std::atomic::compare exchange strong 成 员 函 数 


原子 级 将 值 与 一 个 期 望 值 进 行 比较 ， 并 且 如 果 两 个 值 相 等 ， 就 存储 新 的 值 。 如 果 两 
个 值 不 相等 ， 就 用 读 取 到 的 值 更 新 期 望 值 。 
声明 


bool compare exchange strong( 
BaseType& expected,BaseType new value, 
memory order order - std::memory order seq cst) volatile noexcept; 
bool compare exchange strong( 
BaseType& expected,BaseType new value, 
memory order order - std::memory order seq cst) noexcept; 
bool compare exchange strong( 
BaseType& expected,BaseType new value, 
memory order success order,memory order failure order) 
volatile noexcept; 
bool compare exchange strong( 
BaseType& expected,BaseType new value, 
memory order success order,memory order failure order) noexcept; 


前 置 条 件 

failure order 不 能 是 std::memory order release 或 std::memory 
order acq rel, 

结果 

将 expected 5*this 中 存储 的 值 进行 按 位 比较 ， 并 且 当 相等 时 将 new value 
存储 在 *this 中 ,否则 ,将 expected 更 新 为 读 取 到 的 值 。 

返回 

如 果 *this 中 存在 的 值 与 expected HS, il] true, 否则 false, 

引发 

X. 


注 三 参数 的 重 载 与 带 有 success order--order fi failure_order==order 的 四 参数 
重 载 是 等 效 的 , 除非 order std::memory order acq rel 而 failure order € 
std: :memory order acquire, 或 者 order 是 std::memory order release 而 


failure order 是 std::memory_order relaxed, 


注 “如果 结果 为 true， 这 就 是 对 包括 *this 的 内 存 地 址 的 原子 读 -修改 - 写 操作 ， 带 有 内 存 顺 
Jẹ success order; 否则 ， 它 就 是 对 包括 *this 的 内 存 地 址 的 载 入 操作 ， 带 有 内 存 顺 
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序 failure order, 


std::atomic compare exchange strong 非 成 员 函 数 


将 值 与 一 个 期 望 值 进行 比较 ， 并 且 如 果 两 个 值 相等 ， 就 存储 新 的 值 。 如 果 两 个 值 不 
相等 ， 就 用 读 取 到 的 值 更 新 期 望 值 。 

声明 
template«typename BaseType> 


bool atomic compare exchange strong( 
volatile atomic«BaseType»* p,BaseType * old value,BaseType new value) 
noexcept; 

template<typename BaseType> 

bool atomic compare exchange strong( 
atomic«BaseType»* p,BaseType * old value,BaseType new value) noexcept; 


结果 


return p-»compare exchange strong(*old value,new value); 


std::atomic::compare exchange weak 成 员 函 数 


将 值 与 一 个 期 望 值 进行 比较 ， 并 且 如 果 两 个 值 相等 且 更 新 可 以 在 原子 级 完成 ， 就 存储 
新 的 值 。 如 果 两 个 值 不 相等 或 是 更 新 不 能 在 原子 级 完成 ， 就 用 读 取 到 的 值 更 新 期 望 值 。 
声明 
bool compare exchange weak( 
BaseType& expected,BaseType new value, 
memory order order - std::memory order seq cst) volatile noexcept; 
bool compare exchange weak( 
BaseType& expected,BaseType new value, 
memory order order - std::memory order seq cst) noexcept; 
bool compare exchange weak( 
BaseType& expected,BaseType new value, 
memory order success order,memory order failure order) 
volatile noexcept; 
bool compare exchange weak( 
BaseType& expected,BaseType new value, 
memory order success order,memory order failure order) noexcept; 


前 置 条 件 

failure order 不 能 是 std::memory order release 或 std::memory 
order acq rel, 

结果 

将 expected 与 *this 中 存储 的 值 进 行 按 位 比较 ， 并 且 当 相等 时 将 new value 
存储 在 *this 中 。 如 果 两 个 值 不 相等 或 是 更 新 不 能 原子 级 进行 ， 就 将 expected 更 新 
为 读 取 到 的 值 。 

返回 

如 果 *this 中 存在 的 值 与 expected 相等 且 new value 成 功 存 储 在 *this 中 ， 返 
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fe] true, 否则 false, 
引发 
Ke 

注 三 参数 的 重 载 与 带 有 success_order==order fi failure order--order 的 四 参数 
重 载 是 等 效 的 , 除非 order 是 std::memory order acq rel 而 failure order € 
std::memory order acquire, XÆ order Æ std: :memory order release 而 


failure order € std::memory order relaxed, 


注 如 果 结 果 为 true， 这 就 是 对 包括 *this 的 内 存 地 址 的 原子 读 -修改 - 写 操作 ， 带 有 内 存 顺 
序 success order; 否则 ， 它 就 是 对 包括 *this 的 内 存 地 址 的 载 入 操作 ， 带 有 内 存 顺 


序 failure order, 


std::atomic compare exchange weak 非 成 员 函 数 
将 值 与 一 个 期 望 值 进 行 比 较 ， 并 且 如 果 两 个 值 相等 ， 就 存储 新 的 值 。 如 果 两 个 值 不 


相等 ， 就 用 读 取 到 的 值 更 新 期 望 值 。 
声明 


template<typename BaseType> 
bool atomic_compare_exchange_weak ( 
volatile atomic<BaseType>* p,BaseType * old_value,BaseType new_value) 
noexcept ; 
template<typename BaseType> 


bool atomic_compare_exchange_weak ( 
atomic<BaseType>* p,BaseType * old_value,BaseType new_value) noexcept; 


结果 


return p-»compare exchange weak(*old value,new value); 


std::atomic compare exchange weak 非 成 员 函 数 
将 值 与 一 个 期 望 值 进行 比较 ， 并 且 如 果 两 个 值 相等 ， 就 存储 新 的 值 。 如 果 两 个 值 不 
相等 ， 就 用 读 取 到 的 值 更 新 期 望 值 。 


声明 
template«typename BaseType> 
bool atomic compare exchange weak explicit( 
volatile atomic«BaseType»* p,BaseType * old value, 
BaseType new value, memory order success order, 
memory order failure order) noexcept; 
template<typename BaseType> 
bool atomic compare exchange weak explicit( 
atomic<BaseType>* p,BaseType * old value, 
BaseType new value, memory order success order, 
memory order failure order) noexcept; 
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结果 


return p-»compare exchange weak( 


*old value,new value,success order,failure order); 


D.3.9 std::atomic 模板 的 特 化 


std: :atomic 类 模板 的 特 化 提供 给 整 型 和 指针 类 型 。 对 于 整 型 ， 这 些 特 化 在 主 模 


板 提供 的 操作 之 外 ， 又 额外 提供 了 原子 级 的 加 、 减 和 按 位 操作 。 对 于 指针 类 型 ， 这 一 特 
化 在 主 模板 提供 的 操作 之 外 又 额外 提供 了 原子 级 的 指针 算数 运算 。 


std: 
std: 
std: 
std: 
std: 
std: 
std: 
std: 
std: 
std: 
std: 
std: 
std: 
std: 
std: 


D.3.10 


为 下 面 的 整 型 提供 了 特 化 : 


:atomic<bool> 
:atomic«char» 
:atomic«signed char» 
:atomic«unsigned char» 
:atomic«short» 
:atomic«unsigned short» 
:atomic«int» 
:atomic«unsigned» 
:atomic«long» 
:atomic«unsigned long» 
:atomic«long long» 
:atomic«unsigned long long» 
:atomic«wchar t» 
:atomic«charl6 t» 
:atomic«char32 t» 


以 及 对 所 有 类 型 了 的 stdq: :atomic<T*>, 


std::atomic<integral-type> 特 化 
std::atomic 类 模板 的 std: :atomic<integral-type> 特 化 为 每 一 个 基本 的 


整 型 提供 了 原子 整 型 数据 类 型 ， 同 时 带 有 一 整套 的 操作 。 


std: 
gtd: 
std: 
std: 
std: 
std: 
std: 
std: 
‘std: 
std: 
std: 
std: 
std: 
std: 


下 面 的 描述 应 用 于 这 些 std: :atomic<> 类 模板 的 特 化 。 


:atomic«char» 
:atomic«signed char» 
:atomic«unsigned char» 
:atomic«short» 
:atomic«unsigned short» 
:atomic«int» 
:atomic«unsigned» 
:atomic«long» 
:atomic«unsigned long» 
:atomic«long long» 
:atomic«unsigned long long» 
:atomic«wchar t» 
:atomic«chari6 t» 
:atomic«char32 t» 


这 些 特 化 的 实例 不 是 CopyConstructible 和 CopyAssignable 的 ， 因 为 这 些 
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操作 都 不 能 作为 一 个 单一 原子 操作 来 进行 。 
类 定义 


template<> 
struct atomic<integral-type> 
{ 
atomic() noexcept = default; 
constexpr atomic(integral-type) noexcept; 
bool operators (integral-type) volatile noexcept; 


atomic(const atomic&) = delete; 
atomic& operator-(const atomic&) - delete; 
atomic& operator-(const atomic&) volatile - delete; 


bool is lock free() const volatile noexcept; 
bool is lock free() const noexcept; 


void store(integral-type,memory order - memory order seq cst) 

volatile noexcept; 
void store(integral-type,memory order - memory order seq cst) noexcept; 
integral-type load(memory order - memory order seq cst) 

const volatile noexcept; 
integral-type load(memory order - memory order seq cst) const noexcept; 
integral-type exchange( 

integral-type,memory order - memory order seq cst) 

volatile noexcept; 
integral-type exchange( 

integral-type,memory order - memory order seq cst) noexcept; 


bool compare exchange strong( 
integral-type & old value,integral-type new value, 
memory order order - memory order seq cst) volatile noexcept; 
bool compare exchange strong( 
integral-type & old value,integral-type new value, 
memory order order - memory order seq cst) noexcept; 
bool compare exchange strong( 
integral-type & old value,integral-type new value, 
memory order success order,memory order failure order) 
volatile noexcept; 
bool compare exchange strong( 
integral-type & old value,integral-type new value, 
memory order success order,memory order failure order) noexcept; 
bool compare exchange weak( 
integral-type & old value,integral-type new value, 
memory order order - memory order seq cst) volatile noexcept; 
bool compare exchange weak( 
integral-type & old value,integral-type new value, 
memory order order = memory order seq cst) noexcept; 
bool compare exchange weak( 
integral-type & old value, integral-type new value, 
memory order success order,memory order failure order) 
volatile noexcept; 
bool compare exchange weak( 
integral-type & old value,integral-type new value, 
memory order success order,memory order failure order) noexcept; 
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operator integral-type() const volatile noexcept; 
operator integral-type() const noexcept; 


integral-type fetch add( 
integral-type,memory order - 
volatile noexcept; 
integral-type fetch add( 
integral-type,memory order - 
integral-type fetch sub( 
integral-type,memory order - 
volatile noexcept; 
integral-type fetch sub( 
integral-type,memory order = 
integral-type fetch and( 
integral-type,memory order - 
volatile noexcept; 
integral-type fetch and( 
integral-type,memory order - 
integral-type fetch or( 
integral-type,memory order - 
volatile noexcept; 
integral-type fetch or( 
integral-type,memory order - 
integral-type fetch xor( 
integral-type,memory order - 
volatile noexcept; 
integral-type fetch xor( 
integral-type,memory order = 


memory order seq cst) 


memory order seq cst) noexcept; 


memory order seq cst) 


memory order seq cst) noexcept; 


memory order seq cst) 


memory order seq cst) noexcept; 


memory order seq cst) 


memory order seq cst) noexcept; 


memory order seq cst) 


memory order seq cst) noexcept; 


integral-type 
integral-type 
integral-type 
integral-type 
integral-type 
integral-type 
integral-type 
integral-type 


operator++() volatile noexcept; 
operator««() noexcept; 
operator++(int) volatile noexcept; 
operator++(int) noexcept; 
operator--() volatile noexcept; 
operator--() noexcept; 
operator--(int) volatile noexcept; 
operator--(int) noexcept; 


1m 

bool 
bool 
void 
void 


integral-type 


operator«-(integral-type 


volatile noexcept; 


) 
integral-type operator+=(integral-type) noexcept; 
integral-type operator--(integral-type) volatile noexcept; 
integral-type operator-=(integral-type) noexcept; 
integral-type operator&-(integral-type) volatile noexcept ; 
integral-type operator&=(integral-type) noexcept; 
integral-type operator|=(integral-type) volatile noexcept ; 
integral-type operator|=(integral-type) noexcept ; 
integral-type operator^-(integral-type) volatile noexcept; 
integral-type operator^- (integral-type) noexcept; 


atomic is lock free(volatile const atomic<integral-type>*) noexcept ; 


atomic_is_lock_free(const atomic<integral-type>*) noexcept ; 


atomic_init (volatile atomic<integral-type>*,integral-type) noexcept; 


atomic_init (atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_exchange ( 

volatile atomic<integral-type>*, integral-type) noexcept ; 
integral-type atomic_exchange ( 
atomic<integral-type>*,integral-type) noexcept; 


D.3 <atomic> 头 文件 401 


integral-type atomic exchange explicit( 

volatile atomic<integral-type>*,integral-type, memory order) noexcept; 
integral-type atomic exchange explicit( 

atomic«integral-type»*,integral-type, memory order) noexcept; 
void atomic store(volatile atomic<integral-type>*,integral-type) noexcept; 
void atomic_store (atomic<integral-type>*,integral-type) noexcept; 
void atomic store explicit( 

volatile atomic<integral-type>*,integral-type, memory order) noexcept; 
void atomic store explicit( 

atomic<integral-type>*,integral-type, memory order) noexcept; 
integral-type atomic load(volatile const atomic«integral-type»*) noexcept; 
integral-type atomic load(const atomic<integral-type>*) noexcept; 
integral-type atomic load explicit( 

volatile const atomic«integral-type»*,memory order) noexcept; 
integral-type atomic load explicit( 

const atomic«integral-type»*,memory order) noexcept; 
bool atomic compare exchange strong( 

volatile atomic<integral-type>*, 

integral-type * old value,integral-type new value) noexcept; 
bool atomic compare exchange strong( 

atomic<integral-type>*, 

integral-type * old value,integral-type new value) noexcept; 
bool atomic compare exchange strong explicit( 

volatile atomic<integral-type>*, 

integral-type * old value,integral-type new value, 

memory order success order,memory order failure order) noexcept; 
bool atomic compare exchange strong explicit( 

atomic<integral-type>*, 

integral-type * old value,integral-type new value, 

memory order success order,memory order failure order) noexcept; 
bool atomic compare exchange weak( 

volatile atomic<integral-type>*, 

integral-type * old value,integral-type new value) noexcept; 
bool atomic compare exchange weak( 

atomic<integral-type>*, 

integral-type * old value,integral-type new value) noexcept; 
bool atomic compare exchange weak explicit( 

volatile atomic<integral-type>*, 

integral-type * old value,integral-type new value, 

memory order success order,memory order failure order) noexcept; 
bool atomic compare exchange weak explicit( 

atomic«integral-type»*, 

integral-type * old value,integral-type new value, 

memory order success order,memory order failure order) noexcept; 


integral-type atomic fetch add( 
volatile atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic fetch add( 
atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic fetch add explicit( 
volatile atomic<integral-type>*,integral-type, memory order) noexcept; 
integral-type atomic fetch add explicit( 
atomic<integral-type>*,integral-type, memory order) noexcept; 
integral-type atomic fetch sub( 
volatile atomic«integral-type»*,integral-type) noexcept; 
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integral-type atomic fetch sub( 

atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic fetch sub explicit( 

volatile atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch sub explicit( 

atomic<integral-type>*,integral-type, memory_order) noexcept; 
integral-type atomic fetch and( 

volatile atomic«integral-type»*,integral-type) noexcept; 
integral-type atomic fetch and( 

atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic fetch and explicit( 

volatile atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch and explicit( 

atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch or( 

volatile atomic«integral-type»*,integral-type) noexcept; 
integral-type atomic fetch or( 

atomic«integral-type»*,integral-type) noexcept; 
integral-type atomic fetch or explicit( 

volatile atomic<integral-type>*,integral-type, memory order) noexcept; 
integral-type atomic fetch or explicit( 

atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch xor( 

volatile atomic«integral-type»*,integral-type) noexcept; 
integral-type atomic fetch xor( 

atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_fetch_xor_explicit ( 

volatile atomic<integral-type>*, integral-type, memory order) noexcept; 
integral-type atomic fetch xor explicit( 

atomic«integral-type»*,integral-type, memory order) noexcept; 


在 主 模板 中 同时 提供 的 那些 操作 (参见 D.3.8) 拥有 同样 的 语义 。 


std::atomic«integral-type»::fetch add 成 员 函 数 


载 和 一 个 值 ， 并 且 将 其 蔡 换 为 它 的 值 与 提供 的 i 的 值 之 和 。 
声明 


integral-type fetch add( 
integral-type i,memory order order - memory order seq cst) 
volatile noexcept; 
integral-type fetch add( 
integral-type i,memory order order - memory order seq cst) noexcept; 


结果 

获取 *this 现存 值 并 且 将 旧 值 +i 存储 在 *this 中 。 
返回 

刚刚 在 存储 之 前 的 *this 值 。 

引发 

无 
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注 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 的 读 -修改 - 写 操作 。 


std::atomic fetch add 非 成 员 函 数 
从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 替换 为 该 值 加 上 提供 的 
i fH. 
声明 
integral-type atomic fetch add( 
volatile atomic<integral-type>* p, integral-type i) 


integral-type atomic fetch add( 
atomic<integral-type>* p, integral-type i) noexcept; 


结果 


return p-»fetch add(i); 


noexcept; 


std::atomic fetch add explicit JER 5 E& 2x 
从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 该 值 加 上 提供 的 
i fA. 
声明 


integral-type atomic fetch add explicit( 
volatile atomic<integral-type>* p, integral-type i, 
memory order order) noexcept; 
integral-type atomic fetch add explicit( 
atomic<integral-type>* p, integral-type i, memory order order) 


noexcept; 
结果 


return p-»fetch add(i,order); 


std::atomic«integral-type»::fetch sub Ak 5i E& X 


BLAME, FFE ESS TREY i 的 值 。 
声明 


integral-type fetch sub( 
integral-type i,memory order order - memory order seq cst) 


volatile noexcept; 


integral-type fetch sub( 
integral-type i,memory order order - memory order seq cst) noexcept; 


结果 
获取 *this 现存 值 并 且 将 旧 值 -i 存储 在 *this 中 。 
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返回 

刚刚 在 存储 之 前 的 *this 值 。 
引发 

无 


ib 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 级 的 读 -修改 - 写 操作 ， 


std::atomic fetch sub 非 成 员 函 数 


从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 替换 为 该 值 减 去 提供 的 
i fH. 
声明 


integral-type atomic fetch sub( 

volatile atomic<integral-type>* p, integral-type i) noexcept; 
integral-type atomic fetch sub( 

atomic<integral-type>* p, integral-type i) noexcept; 


结果 


return p-»£etch subi); 


std::atomic fetch sub explicit 非 成 员 函 数 


从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 该 值 减 去 提供 的 i 值 。 
声明 


integral-type atomic fetch sub explicit( 
volatile atomic«integral-type»* p, integral-type i, 
memory order order) noexcept; 
integral-type atomic fetch sub explicit( 
atomic<integral-type>* p, integral-type i, memory order order) 
noexcept; 


结果 


return p-»fetch sub(i,order); 


std::atomic«integral-type»::fetch and 成 员 函 数 
载 人 一 个 值 ， 并 将 其 蔡 换 为 它 的 值 与 所 提供 的 i 值 按 位 与 的 结果 。 


声明 

integral-type fetch and( 
integral-type i,memory order order - memory order seq cst) 
volatile noexcept; 


integral-type fetch and( 
integral-type i,memory order order - memory order seq cst) noexcept; 
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结果 

获取 *this 现存 的 值 ， 并 将 旧 值 &i 存储 在 *this 中 。 
返回 

刚刚 在 存储 之 前 的 *this 值 。 

引发 

无 


注 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 级 的 读 -修改 - 写 操作 。 


std::atomic fetch and 非 成 员 函 数 
从 atomic<integralL-type> 实 例 读 取 值 ， 并 将 其 替换 为 它 的 值 与 所 提供 的 工 值 


按 位 与 的 结果 。 
声明 


integral-type atomic fetch and( 

volatile atomic<integral-type>* p, integral-type i) noexcept; 
integral-type atomic fetch and( 

atomic<integral-type>* p, integral-type i) noexcept; 


结果 


return p-»fetch and(i); 


std::atomic fetch and explicit 非 成 员 函 数 


从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 替换 为 它 的 值 与 所 提供 的 工 值 
按 位 与 的 结果 。 


声明 
integral-type atomic fetch and explicit( 
volatile atomic<integral-type>* p, integral-type i, 
memory order order) noexcept; 
integral-type atomic fetch and explicit( 
atomic<integral-type>* p, integral-type i, memory order order) 


noexcept ; 
结果 
return p-»fetch and(i,order); 
std::atomic«integral-type»::fetch or 成 员 函 数 
载 入 一 个 值 ， 并 将 其 替换 为 它 的 值 与 所 提供 的 i 值 按 位 或 的 结果 。 
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声明 

integral-type fetch or( 
integral-type i,memory order order - memory order seq cst) 
volatile noexcept; 

integral-type fetch or( 


integral-type i,memory order order - memory order seq cst) noexcept; 
结果 

获取 *this 现存 的 值 ， 并 将 旧 值 1i 存储 在 *this rp, 

返回 

刚刚 在 存储 之 前 的 *this 值 。 

引发 

无 


注 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 级 的 读 -修改 - 写 操作 。 
std::atomic fetch or 非 成 员 函 数 


从 atomic<integzal-type> 实 例 读 取 值 ， 并 将 其 替换 为 它 的 值 与 所 提供 的 i 值 
按 位 或 的 结果 。 

声明 
integral-type atomic fetch or( 


volatile atomic<integral-type>* p, integral-type i) noexcept; 
integral-type atomic fetch or( 


atomic«integral-type»* p, integral-type i) noexcept; 
结果 


return p-»fetch or(i); 
std::atomic fetch or explicit 非 成 员 函 数 


从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 替换 为 它 的 值 与 所 提供 的 i 值 
按 位 或 的 结果 。 

声明 
integral-type atomic fetch or explicit( 

volatile atomic<integral-type>* p, integral-type i, 

memory order order) noexcept; 
integral-type atomic fetch or explicit( 


atomic<integral-type>* p, integral-type i, memory order order) 
noexcept; 


结果 


return p-»fetch or(i,order); 


i 
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std::atomic«integral-type»::fetch xor 成 员 函 数 


载 人 一 个 值 ， 并 将 其 替换 为 它 的 值 与 所 提供 的 i 值 按 位 异 或 的 结果 。 
= 
声明 
integral-type fetch xor( 
integral-type i,memory order order - memory order seq cst) 
volatile noexcept; 
integral-type fetch xor( 
integral-type i,memory order order = memory order seq cst) noexcept; 


结果 

获取 *this 现存 的 值 ， 并 将 旧 值 ^i 存储 在 *this 中 。 
返回 

刚刚 在 存储 之 前 的 *this 值 。 

引发 

无 


注 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 级 的 读 -修改 - 写 操作 。 
std::atomic fetch or 非 成 员 函 数 


从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 替换 为 它 的 值 与 所 提供 的 i 值 
按 位 异 或 的 结果 。 

声明 
integral-type atomic fetch xor( 

volatile atomic<integral-type>* p, integral-type i) noexcept; 
integral-type atomic fetch xor( 

atomic<integral-type>* p, integral-type i) noexcept; 


结果 


return p->fetch_xor (i) ; 


std::atomic fetch or explicit 非 成 员 函 数 


从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 它 的 值 与 所 提供 的 i 值 
按 位 异 或 的 结果 。 
声明 


integral-type atomic fetch xor explicit( 
volatile atomic<integral-type>* p, integral-type i, 
memory order order) noexcept; 
integral-type atomic fetch xor explicit( 
atomic<integral-type>* p, integral-type i, memory order order) 
noexcept; 
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结果 


return p-»fetch xor(i,order); 
std::atomic<integral-type>::operator++ 前 置 自 增 运算 符 


递增 存储 在 *this 中 的 值 并 返回 新 值 。 
声明 


integral-type operator++() volatile noexcept; 
integral-type operator««() noexcept; 


结果 
return this-»fetch add(1) + 1; 
std::atomic<integral-type>::operator++ 后 置 自 增 运算 符 
递增 存储 在 *this 中 的 值 并 返回 旧 值 。 
声明 


integral-type operator++(int) volatile noexcept; 
integral-type operator++(int) noexcept; 


结果 
return this-»fetch add(1); 
std::atomic<integral-type>::operator-- 前 置 自 增 运 算 符 
递增 存储 在 *this 中 的 值 并 返回 新 值 。 


= 

声明 
integral-type operator--() volatile noexcept; 
integral-type operator--() noexcept; 

结果 
return this-»fetch sub(1) - 1; 


std::atomic<integral-type>::operator--A Bi E1132: 8 13 
递增 存储 在 *this 中 的 值 并 返回 旧 值 。 
声明 


integral-type operator-- (int) volatile noexcept; 
integral-type operator--(int) noexcept; 


结果 


return this-»fetch sub(1); 
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std'atomic<integral-type>::operator+= 复 合 赋值 运算 符 
将 所 给 的 值 加 到 *this 中 存储 的 值 上 ， 并 返回 新 值 。 
声明 


integral-type operator+=(integral-type i) volatile noexcept; 
integral-type operator«-(integral-type i) noexcept; 


结果 
return this-»fetch add(i) + i; 
std::atomic<integral-type>::operator-= 复 合 赋值 运算 符 


从 *this 中 存储 的 值 减 去 所 给 的 值 ， 并 返回 新 值 。 
声明 


integral-type operator--(integral-type i) volatile noexcept; 
integral-type operator--(integral-type i) noexcept; 


结果 
return this-»fetch sub(i,std::memory order seq cst) - i; 
std::atomic<integral-type>::operator&= 复 合 赋值 运算 符 


将 *this 中 存储 的 值 替换 为 所 给 值 和 存储 在 *this 中 的 值 按 位 与 的 结果 ， 并 返回 
新 值 。 
声明 


integral-type operator&-(integral-type i) volatile noexcept; 
integral-type operator&=(integral-type i) noexcept; 


结果 


return this-»fetch and(i) & i; 


std::atomic«integral-type»::operator|- & & lit (ia FF 


将 *this 中 存储 的 值 蔡 换 为 所 给 值 和 存储 在 *this 中 的 值 按 位 或 的 结果 ， 并 返回 
新 值 。 

声明 
integral-type operator|-(integral-type i) volatile noexcept; 
integral-type operator|=(integral-type i) noexcept; 


结果 


return this-»fetch or(i,std::memory order seq cst) | i; 
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std::atomic<integral-type>::operatorA= 复 合 赋值 运算 符 


将 *this 中 存储 的 值 替换 为 所 给 值 和 存储 在 *this 中 的 值 按 位 异 或 的 结果 ， 并 返 
回 新 值 。 
声明 


integral-type operator^-(integral-type i) volatile noexcept; 
integral-type operator^-(integral-type i) noexcept; 


结果 


return this-»fetch xor(i,std::memory order seq cst) ed 


D.3.11 std::atomic<Tx*> 偏 特 化 


std: :atomic 类 模板 的 std: :atomic<Tx> 偏 特 化 为 每 一 个 指针 类 型 提供 了 原 


子 数据 类 型 ， 同 时 带 有 一 整套 的 操作 。 


这 些 std: :atomic<T*> 的 实例 不 是 CopyConstructible 和 CopyAssignable 的 ， 
因为 这 些 操作 都 不 能 作为 一 个 单一 原子 操作 来 进行 。 
类 定义 
template<typename T> 
struct atomic<T*> 
{ 
atomic() noexcept = default; 
constexpr atomic(T*) noexcept; 


bool operator=(T*) volatile; 
bool operator-(T*); 


atomic(const atomic&) - delete; 
atomic& operator-(const atomic&) - delete; 
atomic& operator-(const atomic&) volatile - delete; 


bool is lock free() const volatile noexcept; 

bool is lock free() const noexcept; 

void store(T*,memory order - memory order seq cst) volatile noexcept; 

void store(T*,memory order - memory order seq cst) noexcept; 

T* load(memory order - memory order seq cst) const volatile noexcept; 

T* load(memory order - memory order seq cst) const noexcept; 

T* exchange(T*,memory order - memory order seq cst) volatile noexcept; 
T* exchange(T*,memory order - memory order seq cst) noexcept; 


bool compare exchange strong( 

T* & old value, T* new value, 

memory order order - memory order seq cst) volatile noexcept; 
bool compare exchange strong( 

T* & old value, T* new value, 

memory order order - memory order seq cst) noexcept; 
bool compare exchange strong( 

T* & old value, T* new value, 


i 
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memory order success order,memory order failure order) 

volatile noexcept; 
bool compare exchange strong( 

T* & old value, T* new value, 

memory order success order,memory order failure order) noexcept; 
bool compare exchange weak( 

T* & old value, T* new value, 

memory order order - memory order seq cst) volatile noexcept; 
bool compare exchange weak( 

T* & old value, T* new value, 

memory order order - memory order seq cst) noexcept; 
bool compare exchange weak( 

T* & old value, T* new value, 

memory order success order,memory order failure order) 

volatile noexcept; 
bool compare exchange weak( 

T* & old value, T* new value, 

memory order success order,memory order failure order) noexcept; 


operator T*() const volatile noexcept; 
operator T*() const noexcept; 


T* fetch add( 

ptrdiff t,memory order - memory order seq cst) volatile noexcept; 
T* fetch add( 

ptrdiff t,memory order - memory order seq cst) noexcept; 
T* fetch sub( 

ptrdiff t,memory order - memory order seq cst) volatile noexcept; 
T* fetch sub( 

ptrdiff t,memory order - memory order seq cst) noexcept; 


T* operator++() volatile noexcept; 

T* operator++() noexcept; 

T* operator++(int) volatile noexcept; 
T* operator++(int) noexcept; 

T* operator--() volatile noexcept; 

T* operator--() noexcept; 


T* operator-- (int) volatile noexcept; 
T* operator--(int) noexcept; 


T* operator«-(ptrdiff t) volatile noexcept; 
T* operator«-(ptrdiff t) noexcept; 
T* operator--(ptrdiff t) volatile noexcept; 
T* operator--(ptrdiff t) noexcept; 


bool atomic is lock free(volatile const atomic«T*»*) noexcept; 
bool atomic is lock free(const atomic«T*»*) noexcept; 

void atomic init(volatile atomic«T*»*, T*) noexcept; 

void atomic init(atomic«T*»*, T*) noexcept; 


T* 
T* 
Tow 


T* 


atomic exchange (volatile atomic<T*>*, T*) noexcept; 

atomic exchange (atomic<T*>*, T*) noexcept; 

atomic exchange explicit (volatile atomic<T*>*, T*, memory order) 
noexcept ; 

atomic exchange explicit (atomic<T*>*, T*, memory order) noexcept; 
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void atomic store(volatile atomic<T*>*, T*) noexcept; 
void atomic store(atomic«T*»*, T*) noexcept; 
void atomic store explicit(volatile atomic«T*»*, T*, memory order) 


noexcept; 


void atomic store explicit(atomic«T*»*, T*, memory order) noexcept; 

T* atomic load(volatile const atomic<T*>*) noexcept; 

T* atomic load(const atomic<T*>*) noexcept; 

T* atomic load explicit(volatile const atomic«T*»*, memory order) noexcept; 
T* atomic load explicit(const atomic<T*>*, memory order) noexcept; 

bool atomic compare exchange strong( 


volatile atomic<T*>*,T* * old value,T* new value) noexcept; 


bool atomic compare exchange strong( 


volatile atomic«T*»*,T* * old value,T* new value) noexcept; 


bool atomic compare exchange strong explicit( 


atomic<T*>*,T* * old value,T* new value, 
memory order success order,memory order failure order) noexcept; 


bool atomic compare exchange strong explicit( 


atomic<T*>*,T* * old value,T* new value, 
memory order success order,memory order failure order) noexcept; 


bool atomic compare exchange weak( 


volatile atomic<T*>*,T* * old value,T* new value) noexcept; 


bool atomic compare exchange weak( 


atomic<T*>*,T* * old value,T* new value) noexcept; 


bool atomic compare exchange weak explicit( 


volatile atomic<T*>*,T* * old_value, T* new_value, 
memory_order success_order,memory_order failure order) noexcept; 


bool atomic compare exchange weak explicit( 


atomic<T*>*,T* * old value, T* new value, 
memory order success order,memory order failure order) noexcept; 


atomic fetch add(volatile atomic«T*»*, ptrdiff t) noexcept; 
atomic fetch add(atomic«T*»*, ptrdiff t) noexcept; 

atomic fetch add explicit( 

volatile atomic<T*>*, ptrdiff t, memory order) noexcept; 
atomic fetch add explicit( 

atomic<T*>*, ptrdiff t, memory order) noexcept; 

atomic fetch sub(volatile atomic«T*»*, ptrdiff t) noexcept; 
atomic fetch sub(atomic«T*»*, ptrdiff t) noexcept; 

atomic fetch sub explicit( 

volatile atomic«T*»*, ptrdiff t, memory order) noexcept; 
atomic fetch sub explicit( 

atomic<T*>*, ptrdiff t, memory order) noexcept; 


在 主 模板 中 同时 提供 的 那些 操作 ( 见 D.3.8) 拥有 同样 的 语义 。 


std::atomic<T*>::fetch_add Ax 5i Em 281 


载 人 一 个 值 ， 并 且 使 用 标准 指针 算术 规则 将 其 蔡 换 为 它 的 值 与 所 给 的 i 的 值 之 和 ， 


并 返回 旧 值 。 


T* 


声明 
fetch add( 
ptrdiff t i,memory order order - memory order seq cst) 
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volatile noexcept; 
T* fetch add( 
ptrdiff t i,memory order order - memory order seq cst) noexcept; 


结果 

获取 *this 现存 值 并 且 将 旧 值 +i 存储 在 *this 中 。 
返回 

刚刚 在 存储 之 前 的 *this 值 。 

引发 

无 


注 这 是 一 项 对 于 包括 *this 的 内 存 地址 的 原子 级 的 读 - 修 改 - 写 操作 ， 


std::atomic fetch add 非 成 员 函 数 


从 atomic<T*> 实 例 读 取 值 , 并 使 用 标准 指针 算术 规则 , 将 其 替换 为 该 值 加 上 提供 
H i fü. 
声明 


T* atomic fetch add(volatile atomic<T*>* p, ptrdiff t i) noexcept; 
T* atomic fetch add(atomic«T*»* p, ptrdiff t i) noexcept; 


结果 


return p-»fetch add(i); 


std::atomic fetch add explicit 非 成 员 函 数 


从 atomic<T*> 实 例 读 取 值 , 并 使 用 标准 指针 算术 规则 ,将 其 替换 为 该 值 加 上 提供 
AY i fe. 
声明 


T* atomic fetch add explicit( 

volatile atomic<T*>* p, ptrdiff t i,memory order order) noexcept; 
T* atomic fetch add explicit( 

atomic<T*>* p, ptrdiff t i, memory order order) noexcept; 


结果 
return p-»fetch add(i,order); 
std::atomic<T*>::fetch_sub 成 员 函 数 


载 人 一 个 值 ， 并 且 使 用 标准 指针 算术 规则 将 其 替换 为 它 的 值 减 去 所 给 的 1 的 值 ， 并 
返回 旧 值 。 
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声明 
T* fetehesuby 


ptrdiff t i,memory order order - memory order seq cst) 
volatile noexcept; 
T* fetch sub( 


ptrdiff t i,memory order order - memory order seq cst) noexcept; 
结果 

获取 *this 现存 值 并 且 将 旧 值 -i 存储 在 *this m, 

返回 

刚刚 在 存储 之 前 的 *this 值 。 

引发 

无 


注 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 级 的 读 - 修 改 - 写 操作 。 
std::atomic_fetch_sub 非 成 员 函 数 


从 atomic<T*> 实 例 读 取 值 , 并 且 使 用 标准 指针 算术 规则 , 将 其 蔡 换 为 它 的 值 减 去 
所 给 的 i 的 值 。 
声明 


T* atomic fetch sub(volatile atomic<T*>* p, ptrdiff t i) noexcept; 
T* atomic fetch sub(atomic«T*»* p, ptrdiff t i) noexcept; 


结果 


return p-»fetch sub(i); 


std::atomic fetch sub explicit 非 成 员 函 数 


从 atomic<T*> 实 例 读 取 值 ， 并 且 使 用 标准 指针 算术 规则 ， MEME CENE 
所 给 的 i 的 值 。 
声明 


T* atomic fetch sub explicit( 

volatile atomic<T*>* p, ptrdiff t i,memory order order) noexcept; 
T* atomic fetch sub explicit( 

atomic<T*>* p, ptrdiff t i, memory order order) noexcept; 


结果 


return p-»fetch sub(i,order); 


std::atomic«T*»::operator-- Bj B Ei 832: Be 
使 用 标准 指针 算术 规则 递增 存储 在 *this 中 的 值 并 返回 新 值 。 
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se 

声明 
T* operator++() volatile noexcept; 
T* operator++() noexcept; 


结果 


return this-»fetch add(i) + i; 


std::atomic<T*>::operator++ 后 置 自 增 运算 符 
使 用 标准 指针 算术 规则 递增 存储 在 *this 中 的 值 并 返回 旧 值 。 
声明 


T* operator++(int) volatile noexcept; 
T* operator++(int) noexcept; 


结果 


return this-»fetch add(1); 
std::atomic<T*>::operator-- 前 置 自 增 运算 符 
使 用 标准 指针 算术 规则 递增 存储 在 *this 中 的 值 并 返回 新 值 。 


= 

声明 
T* operator--() volatile noexcept; 
T* operator--() noexcept; 

结果 


return this-»fetch add(i) + i; 


std::atomic<T*>::operator-- 后 置 自 增 运 算 符 
使 用 标准 指针 算术 规则 递增 存储 在 *this 中 的 值 并 返回 旧 值 。 


= 

声明 
T* operator--(int) volatile noexcept; 
T* operator--(int) noexcept; 


结果 
return this-»fetch sub(1); 
std::atomic<T*>::operator+= 复 合 赋值 运算 符 
使 用 标准 指针 算术 规则 将 所 给 的 值 加 到 *this 中 存储 的 值 上 ， 并 返回 新 值 。 
声明 


T* operator+=(ptrdiff t i) volatile noexcept; 
T* operator«-(ptrdiff t i) noexcept; 
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结果 


return this->fetch_add(i) + i; 


std::atomic«T*»::operator-- & & litf& iz 88 3 


DA 


使 用 标准 指针 算术 规则 从 *this 中 存储 的 值 减 去 所 给 的 值 ， 并 返回 新 值 ， 
声明 


T* operator--(ptrdiff t i) volatile noexcept; 
T* operator--(ptrdiff t i) noexcept ; 


结果 


return this-»fetch sub(i) - i; 


«future» 3L xc 4r 


<future> 头 文件 提供 了 一 些 工具 ， 用 来 处 理 来 自 于 可 能 执行 在 另 一 个 线程 上 的 操 


作 的 异步 结果 。 


头 文件 内 容 


namespace std 


enum class future status { 
ready, timeout, deferred }; 


enum class future errc 


{ 


broken promise, 

future already retrieved, 
promise already satisfied, 
no state 


M 
class future error; 
const error category& future category(); 


error code make error code(future errc e); 
error condition make error condition(future errc e)? 


template<typename ResultType> 
class future; 


template<typename ResultType> 
class shared_future; 


template<typename ResultType> 
class promise; 


template<typename FunctionSignature> 
class packaged_task; // no definition provided 
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template<typename ResultType,typename ... Args> 
class packaged task«ResultType (Args...)»; 


enum class launch { 
async, deferred 


}; 


template<typename FunctionType,typename ... Args> 
future<result of<FunctionType (Args...)>::type> 
async(FunctionType&& func,Args&& ... args); 

template«typename FunctionType,typename ... Args> 
future«result of«FunctionType (Args...)»::type» 
async(std::launch policy,FunctionType&& func,Args&& ... args); 


D.4.1 std::future 类 模板 


std: : future 类 模板 提供 了 从 另 一 线程 等 待 异步 结果 的 方法 ,与 std:: promise, 
std: :packaged task 类 模板 和 std: :async 函数 模板 联合 使 用 , 可 以 用 来 提供 此 异步 
结果 。 在 任意 时 刻 ， 只 有 一 个 sta: : future 实例 引用 所 有 给 定 的 异步 结果 。 

std: :future 的 实例 是 MoveConstructible 和 MoveAssignable 的 , 但 不 
是 CopyConstructible 或 CopyAssignable ff), 

类 定义 
template<typename ResultType> 
class future 
{ 
public: 

future() noexcept; 

future(future&&) noexcept; 

future& operator-(future&&) noexcept; 


-future(); 
future(future const&) = delete; 
future& operator-(future const&) - delete; 


shared future«ResultType» share(); 
bool valid() const noexcept; 

see description get(); 

void wait(); 


template«typename Rep,typename Period» 
future status wait for( 
std::chrono::duration«Rep,Period» const& relative time); 


template«typename Clock,typename Duration» 
future status wait until( 
std::chrono::time point«Clock,Duration» const& absolute time); 
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std::future 默认 构造 函数 
构造 与 异步 结果 没有 关联 的 std: : future 对 象 。 


声明 
future() noexcept; 
结果 
构造 一 个 新 的 std: : future 实例 。 
后 置 条 件 
valid() 返 回 false, 
引发 
无 。 


std::future 移动 构造 函数 


从 另 一 个 std: : future 对 象 中 构造 sta: : future HR, 将 与 另 一 std: : future 
对 象 关 联 的 异步 结果 的 所 有 权 转 移 到 新 构造 的 实例 中 。 

声明 
future(future&& other) noexcept; 

结果 

从 other 移动 构造 一 个 新 的 std: : future 实例 。 

后 置 条 件 

在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std::future 对 象 。other 没有 关联 异步 结果 。this->valid() 的 返回 值 与 在 调用 
这 一 构造 函数 之 前 other .valid() 会 返回 的 值 相同 。other .valid() 返回 false, 

引发 

X. 


std::future 移动 赋值 运算 符 
将 于 一 个 std: : future 对 象 关联 的 异步 结果 的 所 有 权 转移 到 另 一 个 对 象 中 。 
声明 
future(future&& other) noexcept; 


结果 
在 std: : future 实例 间 转移 异步 状态 的 所 有 权 。 
后 置 条 件 
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在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std: :future WR, other 没有 关联 异步 结果 。 在 调用 前 关联 至 *this 的 异步 状态 〈 如 果 
有 ) 的 所 有 权 被 释放 ， 如 果 这 是 最 后 一 个 引用 则 状态 被 销毁 。this->valid() 的 返回 值 与 
在 调用 这 一 构造 函数 之 前 other .valid () 会 返回 的 值 相同 .other .valid 1() 返回 false, 

引发 

3X. 


std::future 析 构 函数 
销毁 std: : future 对 象 。 


声明 
~future () ; 

结果 

销毁 *this。 如 果 这 是 对 关联 至 *this 的 异步 结果 WRA) 的 最 后 一 个 引用 ， 那 
么 销毁 该 异步 结果 。 

引发 

X. 


std::future::share 成 员 函 数 


构造 新 的 std::shared future 实例 ， 并 将 关联 至 *this 的 异步 结果 的 所 有 权 
转移 至 这 个 新 构造 的 std: :shared future 实例 。 

声明 
shared future«ResultType» share(); 

结果 

如 同 shared future«ResultType» (std: :move 人 二 

后 置 条 件 

如 果 有 调用 share () ， 那 么 在 调用 它 之 前 关联 至 *this 的 异步 结果 ， 现 在 关联 至 
新 构造 的 std: :shared future 实例 。this->valid() 返 回 false, 

引发 

75. 


std::future::valid 成 员 函 数 


检查 std: : future 实例 是 否 关联 至 异步 结果 。 
声明 


bool valid() const noexcept; 


Men, 
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返回 

如 果 *this 已 关联 至 异步 结果 ， 返 回 true, TR false, 
引发 

无 。 


std::future::wait 成 员 函 数 


如 果 关 联 至 *this 的 状态 包含 延迟 函数 , 调用 此 延迟 函数 。 否则, 一 直 等 待 到 关联 
至 std::future 实例 的 异步 结果 就 绪 。 

声明 
void wait(); 

前 置 条 件 

this->valid() 应 返回 true, 

结果 

如 果 关 联 状态 包含 延迟 函数 , 调用 此 延迟 函数 并 存储 返回 值 或 将 引发 的 异常 存储 为 
异步 结果 。 否 则 ， 阻 塞 直 到 关联 至 *this 的 异步 结果 就 绪 。 

引发 

Ke. 


std::future::wait_for 成员 函 数 


一 直 等 到 关联 至 std::future 实例 的 异步 结果 就 绪 ， 或 者 直到 指定 的 时 间 段 
逝去 。 
声明 
template<typename Rep,typename Period> 


future status wait for( 
std::chrono::duration<Rep, Period> const& relative time); 


前 置 条 件 

this->valid() 应 返回 true。 

结果 

如 果 关 联 至 *this 的 异步 结果 包含 延迟 函数 , CRAM std:async 的 调用 发 起 的 
且 尚 未 开始 执行 , 则 立即 返回 不 进行 阻塞 。 否则 一 直 阻 塞 到 关联 至 *this 的 异步 结果 就 
绪 ， 或 者 由 relative time 指定 的 时 间 段 逝去 。 

返回 

如 果 关 联 至 *this 的 异步 调用 包含 延迟 函数 , 它 是 从 对 std:async 的 调用 发 起 的 
且 尚 未 开始 执行 , 返回 std: :future status::deferred, 如 果 关 联 至 *this HH 
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oh Rae, Wels] std::future_status::ready, WRH relative time 指定 
的 时 间 段 逝去 则 返回 std: :future status::timeout, 


注 线程 可 能 会 比 指定 的 时 间 段 阻塞 得 更 久 。 如 果 可 能 ， 逝 去 时 间 应 由 多 速 时 钟 决定 。 


引发 
9D. 


std::future::wait until 成 员 函 数 


一 直 等 到 关联 至 std: :future 实例 的 异步 结果 就 绪 ， 或 者 到 达 一 个 指定 的 
时 间 。 
声明 


template«typename Clock,typename Duration» 
future status wait until( 


std::chrono::time_point<Clock,Duration> const& absolute time); 

前 置 条 件 

this->valid() 应 返回 上 rue。 

结果 

如 果 关 联 至 *this 的 异步 结果 包含 延迟 函数 , 它 是 从 对 std:async 的 调用 发 起 的 
且 尚 未 开始 执行 ,， 则 立即 返回 不 进行 阻塞 。 和 否则 一 直 阻 塞 到 关联 至 *this 的 异步 结果 就 
绪 ， 或 者 Clock: :now() 返 回 一 个 等 于 或 晚 于 absolute time 的 时 间 。 

返回 

如 果 关 联 至 *this 的 异步 调用 包含 延迟 函数 ， 它 是 从 对 std:async 的 调用 发 
起 的 且 尚 未 开始 执行 ， 返 回 std::future status::deferred, 如 果 关 联 至 
*this WARS, IG) std::future status::ready, 如 果 Clock:: 
now() 返回 一 个 等 于 或 晚 于 absolute time 的 时 间 则 返回 std::future_ 


status::timeout, 


注 不 能 保证 调用 线程 会 被 阻塞 多 久 ， 只 有 当 函 数 返 回 std::future status::timeout, 


H Clock::now()i&[El —^4&-F AT absolute time 的 时 间 的 时 候 ， 线 程 才 会 被 解 
A. 


引发 
无 。 


std::future::get 成 员 函 数 


如 果 关 联 着 的 状态 包含 一 个 来 自 对 std::async 调用 的 延迟 函数 ， 调 用 该 函数 并 
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返回 值 ; 否则 , 一 直 等 待 到 关联 至 std: :future 实例 的 异步 结果 就 绕 ， 接 着 返回 存储 
的 值 或 引发 存储 的 异常 。 
声明 


void future«void»::get(); 
R& future«R&»::get(); 
R future«cR»::get(); 


前 置 条 件 

this->valid() 应 返回 true, 

结果 

如 果 关 联 至 *this 的 状态 包含 延迟 函数 ,调用 该 延迟 函数 并 且 返 回 结 果 或 者 传播 任 
何 已 引发 的 异常 。 

否则 , 一 直 阻塞 到 关联 至 *this 的 异步 结果 就 绪 。 如 果 结 果 是 存储 的 异常 ， 引 发 该 
异常 。 否 则 ， 返 回 存储 的 值 。 

返回 

如 果 关 联 的 状态 包含 延迟 函数 ,返回 该 函数 调用 的 结果 。 否 则 , 如果 ResultType 
是 void， 调 用 正常 返回 。 如 果 ResultType 是 某 些 类 型 R 的 R&， 返 回 存储 的 引用 。 
否则 ， 返 回 存储 的 值 。 

引发 

由 延迟 函数 引发 的 异常 ， 或 存储 在 异步 结果 中 的 异常 ， 如 果 有 的 话 。 

后 置 条 件 


this->valid()==false 


D.4.2 std::shared future 类 模板 


std::shared future 类 模板 提供 了 从 另 一 线程 等 待 异步 结果 的 方法 ， 与 
std::promise, std::packaged task 类 模板 和 std: :async 函数 模板 联合 使 
用 ， 可 以 用 来 提供 此 异步 结果 。 多 个 std: : shared future 实例 可 以 引用 同一 个 异 
步 结 果 。 

std::shared future 的 实例 是 CopyConstructible 或 CopyAssignable 
的 。 你 也 可 以 从 具有 相同 ResultType 的 std::future 中 移动 构造 一 个 
Std::shared furture, 

访问 给 定 的 std::shared future 实例 不 是 同步 的 。 因 此 多 个 线程 在 没有 外 部 同 
步 的 情况 下 访问 同一 个 std: :shared_future 实例 是 不 安全 的 。 但 是 访问 关联 状态 是 
同步 的 ， 所 以 多 个 线程 在 没有 外 部 同步 的 情况 下 ， 各 自 访问 共享 相同 的 关联 状态 的 
std::shared future 独立 的 实例 是 安全 的 。 
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类 定义 
template<typename ResultType» 
class shared future 
{ 
public: 
shared_future() noexcept; 
shared_future (future<ResultType>&&) noexcept; 


Shared future(shared future&&) noexcept; 

shared future(shared future const&); 

shared future& operator-(shared future const&); 
Shared future& operator-(shared future&&) noexcept; 
~shared_future() ; 


bool valid() const noexcept; 
see description get() const; 
void wait() const; 


template«typename Rep,typename Period» 
future status wait for( 
std::chrono::duration<Rep, Period> const& relative time) const; 


template<typename Clock,typename Duration» 
future status wait until( 

std::chrono::time point«Clock,Duration» const& absolute time) 
const; 


]3 


std::shared future 默认 构造 函数 
构造 与 异步 结果 没有 关联 的 std::shared future 对 象 。 


声明 
Shared future() noexcept; 
结果 
构造 一 个 新 的 std: :shared future 实例 。 
后 置 条 件 
对 于 新 构造 的 实例 ，valiq() 返回 false, 
引发 
Tee 


std::shared future 移动 构造 函数 


从 另 一 个 std::shared future 对 象 中 构造 std: : shared_future 对 象 ， 
将 与 另 一 std::shared future 对 象 关 联 的 异步 结果 的 所 有 权 转 移 到 新 构造 的 实 
例 中 。 
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声明 
Shared future(shared future&& other) noexcept; 
结果 
从 other 移动 构造 一 个 新 的 std: :shared future 实例 。 
后 置 条 件 
在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std::shared future WH, other 没有 关联 异步 结果 。 


引发 


std::shared future 从 std::future 的 移动 构造 函数 


从 一 个 std::future 对 象 中 构造 std::shared future 对 象 ， 将 与 
std: :future 对 象 关 联 的 异步 结果 的 所 有 权 转 移 到 新 构造 的 实例 中 。 


声明 


shared future(std::future«ResultType»&& other) noexcept; 

结果 

从 other 移动 构造 一 个 新 的 std::shared future 实例 。 

后 置 条 件 

在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std::shared future 对 象 。other 没有 关联 异步 结果 。 

引发 

Ji. 


std::shared future 拷贝 构造 函数 


从 男 一 个 std::shared future 对 象 中 构造 std::shared future WR, A 
而 源 和 副本 都 会 指向 与 源 std::shared future 对 象 关 联 的 异步 结果 ， 如 果 有 的 话 。 


声明 

shared future(shared future const& other); 
结果 
构造 一 个 新 的 std::shared future 实例 。 
后 置 条 件 


在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std::shared future 对 象 和 other, 
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引发 
TGs 


std::shared future 析 构 函数 


销毁 std::shared future WR, 

声明 
-Shared future(); 

结果 

销毁 *this。 如 果 不 再 有 std: :Promise M std::packaged task 实例 与 关联 
至 *this 的 异步 结果 相关 联 ， 并 且 这 是 对 关联 至 *this 的 异步 结果 的 最 后 一 个 
std: :shared future， 那么 销毁 该 异步 结果 。 

引发 

X. 


std::shared future::valid 成 员 函 数 
检查 std::shared future 实例 是 否 关 联 至 异步 结果 。 


声明 
bool valid() const noexcept; 
返回 
如 果 *this 已 关联 至 异步 结果 ， 返 回 true， 和 否则 返回 false, 
引发 
无 。 


std::shared future::wait 成 员 函 数 


如 果 关 联 至 *this 的 状态 包含 延迟 函数 , 调用 此 延迟 函数 。 否则 , 一 直 等 待 到 关联 
至 std::shared future 实例 的 异步 结果 就 绪 。 

声明 
void wait() const; 

前 置 条 件 

this->valid() 应 返回 true, 

结果 

来 自在 共享 相同 关联 状态 的 std::shared future 实例 上 多 线程 的 get () 和 
wait O 调用 是 序列 化 的 。 如 果 关 联 状态 包含 延迟 函数 ， 首 次 调用 get () 或 wait () 会 
调用 此 延迟 函数 并 存储 返回 值 或 将 引发 的 异常 存储 为 异步 结果 。 
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阻塞 直到 关联 至 *this 的 异步 结果 就 绪 。 
引发 
X. 


std::shared future::wait for 成 员 函 数 


一 直 等 待 到 关联 至 std::shared future 实例 的 异步 结果 就 绪 , 或 者 直到 指定 的 
时 间 有 段 逝 去 。 

声明 
template«typename Rep,typename Period> 


future status wait for( 
std: :chrono: :duration<Rep, Period> const& relative time) const; 


前 置 条 件 

this->valid() 应 返回 true。 

结果 

如 果 关 联 至 *this 的 异步 结果 包含 延迟 函数 , 它 是 从 对 std: async 的 调用 发 起 的 
且 尚 未 开始 执行 , 则 立即 返回 不 进行 阻塞 。 否则 一 直 阻 塞 到 关联 至 *this 的 异步 结果 就 
绪 ， 或 者 由 relative time 指定 的 时 间 段 逝去 。 

返回 

如 果 关 联 至 *this 的 异步 调用 包含 延迟 函数 , 它 是 从 对 std: async 的 调用 发 起 的 
且 尚 未 开始 执行 , 返回 std::future status::deferred, 如 果 关 联 至 *this 的 异 
步 结 果 就 绕 ， 返 回 std::future status::ready， 如 果 由 relative time 指定 
的 时 间 段 逝去 则 返回 std::future status::timeout, 


注 线程 可 能 会 比 指定 的 时 间 段 阻塞 得 更 久 。 如 果 可 能 ， 逝 去 时 间 应 由 匀速 时 钟 决定 ， 


引发 
Z5. 


std::shared future::wait until 成 员 函 数 


一 直 等 待 到 关联 至 std::shared future 实例 的 异步 结果 就 绪 , 或 者 到 达 一 个 指 
定 的 时 间 。 
声明 


template<typename Clock,typename Duration» 
bool wait until( 
Std::chrono::time point«Clock,Duration» const& absolute time) const; 


前 置 条 件 
this->valid() 应 返回 true, 
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结果 

如 果 关 联 至 *this 的 异步 结果 包含 延迟 函数 , 它 是 从 对 stdiasync 的 调用 发 起 的 
且 尚 未 开始 执行 , 则 立即 返回 不 进行 阻塞 。 否则 一 直 阻 塞 到 关联 至 *this 的 异步 结果 就 
绪 ， 或 者 Clock: :now() 返回 一 个 等 于 或 晚 于 absolute time 的 时 间 。 

返回 

如 果 关 联 至 *this 的 异步 调用 包含 延迟 函数 , CRAM std:async 的 调用 发 起 的 
且 尚 未 开始 执行 , 返回 std::future status::deferred, 如果 关联 至 *this 的 异 
步 结果 就 绪 ， 返 回 std: :future_status: :ready， 如 果 Clock: :now() 返 回 一 个 
等 于 或 晚 于 absolute time 的 时 间 则 返回 std::future status::timeout, 


HO 不 能 保证 调用 线程 会 被 阻塞 多 久 ， 只 有 当 函 数 返 回 std::future status:: 
timeout, H Clock: :now() 返回 一 个 等 于 或 晚 于 absolute_time 的 时 间 的 时 候 ， 
线程 才 会 被 解锁 。 


引发 
Jos 


std::shared_future::get 成 员 函 数 


如 果 关 联 着 的 状态 包含 一 个 来 自 对 std::async 调用 的 延迟 函数 ， 调 用 该 函数 并 
返回 值 。 否则 , 一 直 等 待 到 关联 至 std::shared future 实例 的 异步 结果 就 绪 ， 接 着 
返回 存储 的 值 或 引发 存储 的 异常 。 

声明 
void shared future«void»::get() const; 


R& shared future«R&»::get() const; 
R const& shared future«R»::get() const; 


前 置 条 件 

this->valid() ME] true, 

结果 

来 自在 共享 相同 关联 状态 的 sta: : shared_ future 实例 上 多 线程 的 get O 和 
wait () 调用 是 序列 化 的 。 如 果 关 联 状态 包含 延迟 函数 ， 首 次 调用 get () 或 wait () 会 
调用 此 延迟 函数 并 存储 返回 值 或 将 引发 的 异常 存储 为 异步 结果 。 

一 直 阻 塞 到 关联 至 *this 的 异步 结果 就 绪 。 如 果 结 果 是 存储 的 异常 ， 引 发 该 异常 。 
否则 ， 返 回 存储 的 值 。 

返回 

如 果 ResultType 是 void， 正常 返回 。 如 果 ResultType 是 某 些 类 型 R 的 R&， 
返回 存储 的 引用 。 和 否则 ， 返 回 对 存储 值 的 const 引用 。 
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引发 
存储 的 异常 ， 如 果 有 的 话 。 


D.4.3 std::packaged task 类 模板 


std::packaged task 类 模板 打包 了 函数 或 其 他 可 调用 对 象 ， 以 便 在 函数 经 过 
std::packaged task 实例 调用 的 时 候 ， 结 果 被 存储 为 异步 结果 ， 可 以 通过 
std::future 的 实例 来 取得 。 

std::packaged task 的 实例 是 MoveConstructible fll MoveAssignable 
的 ， 但 不 是 CopyConstructible W CopyAssignable 的 。 

类 定义 
template<typename FunctionType> 
class packaged_task; // undefined 


template<typename ResultType,typename... ArgTypes> 
class packaged_task<ResultType (ArgTypes...) > 


{ 


public: 


packaged_task() noexcept; 
packaged_task (packaged_task&&) noexcept; 
~packaged_task() ; 


packaged_task& operator=(packaged_task&&) noexcept; 


packaged task(packaged task const&) = delete; 
packaged_task& operator=(packaged_task const&) = delete; 


void swap (packaged_task&) noexcept; 


template<typename Callable> 
explicit packaged task(Callable&& func); 


template«typename Callable,typename Allocator» 
packaged task(std::allocator arg t, const Allocator&,Callable&&); 


bool valid() const noexcept; 
Std::future«ResultType» get future(); 

void operator() (ArgTypes...); 

void make ready at thread exit (ArgTypes...); 
void reset(); 


lm 


std::packaged task 默认 构造 函数 


构造 std::packaged task WR, 
m 
声明 


packaged task() noexcept; 
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结果 

构造 没有 关联 任务 和 异步 结果 的 std: packaged task 实例 。 
引发 

Fi 


std::packaged_task 从 可 调用 对 象 的 构造 函数 


构造 有 关联 任务 和 异步 结果 的 std: packaged task 实例 。 
= 
声明 

template«typename Callable> 

packaged task(Callable&& func); 


前 置 条 件 

表达 式 func (args...) MAR, 这 里 args.. .中 的 每 个 元 素 args-i 都 必须 
是 相应 的 ArgTypes... 中 ArgType-i 类 型 的 值 。 返 回 值 必须 能 够 转换 为 
ResultType, 

结果 

构造 std::packaged task 实例 ， 带 有 未 就 绪 的 ResultType 类 型 的 关联 异步 
结果 以 及 func 副本 的 Callable 类 型 的 关联 任务 。 

引发 

如 果 构 造 函 数 不 能 为 异步 结果 分 配 内 存 ， 引 发 std: :bad_alloc 的 异常 。 
Callable 的 拷贝 或 移动 构造 函数 引发 的 任何 异常 。 


std::packaged task 从 带 有 分 配器 的 可 调用 对 象 的 构造 函数 


构造 有 关联 任务 和 异步 结果 的 std: :packaged_task 实例 , 使 用 所 给 的 分 配器 来 
为 关联 的 异步 结果 和 任务 分 配 内 存 。 

声明 
template<typename Allocator,typename Callable> 


packaged task( 
Std::allocator arg t, Allocator const& alloc,Callable&& func); 


前 置 条 件 

表达 式 func (args...) 应 有 效 ， 这 里 args.. .中 的 每 个 元 素 args-i 都 必须 是 
相应 的 ArgTypes. . .中 ArgType-i 类 型 的 值 .返回 值 必须 能 够 转换 为 ResultType。 

结果 

构造 std::packaged task 实例 ， 带 有 未 就 绪 的 ResultType 类 型 的 关联 异步 
结果 以 及 func 副本 的 Callable 类 型 的 关联 任务 。 异 步 结果 和 任务 的 内 存 是 通过 分 配 
器 alloc 或 其 副本 来 分 配 的 。 
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引发 
如 果 构 造 函 数 不 能 为 异步 结果 分 配 内 存 ， 引 发 std::bad alloc 的 异常 。 由 
Callable 的 拷贝 或 移动 构造 函数 引发 的 任何 异常 。 


std::packaged task 移动 构造 函数 


从 另 一 个 std: :packaged task 对 象 中 构造 std: :packaged task WR, 
将 与 男 一 std::packaged task 对 象 关 联 的 异步 结果 的 所 有 权 转 移 到 新 构造 的 实 
例 中 。 

声明 
packaged task(packaged task&& other) noexcept; 

结果 

从 other 移动 构造 一 个 新 的 std: :packaged task 实例 。 

后 置 条 件 

在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std::packaged task 对 象 。other 没有 关联 异步 结果 。 

引发 

v 


std::packaged task 移动 赋值 运算 符 


将 于 一 个 std::packaged task 对 象 关联 的 异步 结果 的 所 有 权 转 移 到 另 一 个 对 
象 中 。 

声明 
packaged task& operator=(packaged_task&& other) noexcept; 

结果 
将 关联 至 other 的 异步 结果 和 任务 的 所 有 权 转 移 至 *this， 并 且 合 弃 所 有 之 前 的 
异步 结果 ， 如 同 std: :packaged task (other) .swap(*this) 。 

后 置 条 件 

在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std: : future WR, other 没有 关联 异步 结果 。 

引发 

di 


std::packaged task::swap KR ER 281 
交换 关联 至 两 个 std: :packaged task 对 象 的 异步 结果 的 所 有 权 。 
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声明 
void swap(packaged task& other) noexcept; 


结果 

交换 关联 至 other 和 *this 的 异步 结果 的 所 有 权 。 

后 置 条 件 

在 调用 swap 之 前 关联 至 other 的 异步 结果 和 任务 (如 果 有 ) 现在 关联 至 *this。 
在 调用 swap 之 前 关联 至 *this 的 异步 结果 和 任务 (如果 有 ) 现在 关联 至 other, 

引发 

无 。 


std::packaged_task 析 构 函数 


销毁 std: :packaged_task 对象。 

声明 
~packaged_task () ; 

结果 

销毁 *this。 如 果 *this 拥有 关联 的 异步 结果 ， 且 该 结果 没有 存储 任务 或 异常 ， 那 
入 此 结果 变 成 就 缮 ， 带 有 std: :future_errc: :broken promise 错误 码 的 
std::future error 异常 。 

引发 

Tee 


std::packaged_task::get_future 成 员 函 数 
为 关联 至 *this 的 异步 结果 获取 std: : future 实例 。 


声明 
std: :future<ResultType> get future(); 


前 置 条 件 

*this 拥有 关联 的 异步 结果 。 

返回 

针对 关联 至 *this 的 异步 结果 的 std: : future 实例 。 

引发 

如 果 std: :future 已 经 在 之 前 通过 调用 get_future() 获取 过 了 ; 引发 带 有 
std::future errc::future already retrieved ee A AY std: :future_ 


error 类 型 的 异常 。 
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std::packaged_task::reset 成 员 函 数 
为 同一 个 任务 关联 std: :packaged task 至 新 的 异步 结果 。 


声明 
void reset(); 

前 置 条 件 

*this 拥有 关联 的 异步 任务 。 

结果 

如 同 *this=packaged task(std::move(f)), KH f 是 已 存储 的 关联 至 
*this 的 任务 。 

引发 

如 果 不 能 为 新 的 异步 结果 分 配 内 存 ， 引 发 std: :pad_alloc 的 异常 。 


std::packaged_task::valid 成 员 函 数 
检查 *this 是 否 拥 有 相关 联 的 已 步 结果 。 


声明 
bool valid() const noexcept; 
返回 
如 果 *this 已 关联 至 异步 结果 ， 返 回 true, 否则 返回 false, 
引发 
Jn. 


std::packaged task::operator() 函 数 调用 运算 符 


调用 关联 至 std: :packaged task 实例 的 任务 , 并 且 将 返回 值 或 异常 存储 在 相关 
联 的 异步 结果 中 。 
声明 


void operator() (ArgTypes... args); 


前 置 条 件 

*this 拥有 关联 的 任务 。 

结果 

像 INVOKE (func,args...) 那样 调用 关联 的 任务 func。 如 果 调 用 正常 地 返回 ， 
将 返回 值 存储 在 关联 至 *this 的 异步 结果 中 。 如 果 调 用 带 有 异常 地 返回 , 将 异常 存储 在 
关联 至 *this 的 异步 结果 中 。 
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后 置 条 件 

关联 至 *this 的 异步 结果 就 绪 , 带 有 存储 的 值 或 异常 。 所 有 等 待 异 步 结 果 的 被 阻塞 
线程 全 部 解除 阻塞 。 

引发 

如 果 蜡 步 结果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 带 有 std::future errc:: 
promise already satisfied 错误 码 的 std: :future_error 类 型 的 异常 。 

同步 

成 功 的 对 函数 调用 运算 符 进行 调用 ,与 对 std: : future<ResultType>: :get () 
或 std::shared future<ResultType>: :get() 的 调用 同步 ， 它 们 获取 已 存储 的 
值 或 异常 。 


std::packaged task::make ready at thread exit 成 员 函 数 


调用 关联 至 std: :packaged task 实例 的 任务 , 并 且 将 返回 值 或 异常 存储 在 相关 
联 的 异步 结果 中 ， 直 到 线程 结束 前 都 不 将 关联 的 异步 结果 变 为 就 绪 。 

声明 

void make ready at thread exit(ArgTypes... args); 

前 置 条 件 

*this 拥有 关联 的 任务 。 

结果 

像 INVOKE (func,args...) 那 样 调用 关联 的 任务 func。 如 果 调 用 正常 地 返 
回 ， 将 返回 值 存 储 在 关联 至 *this 的 异步 结果 中 。 如 果 调 用 带 有 异常 地 返回 ， 将 异 
常 存储 在 关联 至 *this 的 异步 结果 中 。 调 度 关 联 的 异步 状态 在 当前 线程 退出 的 时 候 

后 置 条 件 

关联 至 *this 的 异步 结果 拥有 存储 的 值 或 异常 ,但 直到 当前 线程 推出 之 前 都 不 是 就 
绪 的 。 所 有 等 待 异步 结果 的 被 阻塞 线程 在 当前 线程 退出 时 全 部 解除 阻塞 。 

引发 

如 果 异 步 结果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 带 有 std::future errc:: 
promise already satisfied 错误 码 的 std: :future_error 类 型 的 异常 。 如 果 
*this 没有 相关 联 的 同步 状态 ， 引 发 带 有 std::future errc::no_state 的 
std::future error 类 型 的 异常 。 

同步 

成 功 的 对 函数 调用 运算 符 进行 调用 ,与 对 std: : future<ResultType>: :get () 
或 std: :shared future<ResultType>: :get() 的 调用 同步 ， 它 们 获取 已 存储 的 
值 或 异常 。 
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D.4.4  std::promise 类 模板 


std: :promi se 类 模板 提供 了 从 设置 异步 结果 的 方法 ， 可 以 通过 std::future 


实例 从 另 一 线程 获取 它 。 


ResultType 模板 参数 是 可 以 被 存储 在 异步 结果 的 值 的 类 型 。 
关联 至 特定 的 std: :promise 实例 的 异步 结果 的 std: :future 可 以 通过 调用 


get future () 成 员 函 数 来 获得 。 异 步 结果 既 可 以 用 set value O 成 员 函 数 设 置 为 
ResultType 类 型 的 值 ， 也 可 以 使 用 set exception O 成 员 函 数 设置 为 一 个 异常 。 


std::future 的 实例 是 MoveConstructible fl MoveAssignable 的 ， 但 不 


是 CopyConstructible mR CopyAssignable 的 。 


类 定义 


template<typename ResultType» 
class promise 


( 


public: 


yi 


promise () ; 

promise (promise&&) noexcept; 
^promise(); 

promise& operator- (promise&&) noexcept; 


template<typename Allocator» 
promise(std::allocator arg t, Allocator const&); 


promise(promise const&) = delete; 
promise& operator-(promise const&) - delete; 


void swap(promise& ) noexcept; 
Std::future«ResultType» get future(); 


void set value(see description); 
void set exception(std::exception ptr p); 


std::promise 默认 构造 函数 


构造 std: :promise WH, 
声明 


promise () ; 


结果 

构造 std: :promise 实例 , 与 一 个 没有 就 绪 的 ResultType 类 型 的 异步 结果 相关 联 。 
引发 

如 果 构 造 函数 不 能 为 异步 结果 分 配 内 存 ， 引 发 std: :bad_alloc 异常 。 
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std::promise 分 配器 构造 函数 
构造 std: :promise 对 象 ， 使 用 所 给 的 分 配器 为 关联 的 异步 结果 分 配 内 存 。 


声明 
template<typename Allocator» 
promise(std::allocator arg t, Allocator const& alloc); 


结果 

构造 std: :promise 实例 , 与 一 个 没有 就 绪 的 ResultType 类 型 的 异步 结果 相关 
联 。 通 过 分 配器 alloc 为 异步 结果 分 配 内 存 。 

引发 

构造 器 在 试图 为 异步 结果 分 配 内 存 是 引发 的 所 有 异常 。 


std::promise 移动 构造 函数 


从 另 一 个 std: :promise 对 象 中 构造 std::promise 对 象 ， 将 与 另 一 
std: :promise 对 象 关联 的 异步 结果 的 所 有 权 转 移 到 新 构造 的 实例 中 。 

声明 
promise(promise&& other) noexcept; 

结果 

构造 一 个 新 的 std::promise 实例 。 

后 置 条 件 

在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std::promise WR, other 没有 关联 异步 结果 。 

引发 

X. 


std::promise 移动 赋值 运算 符 
将 于 一 个 std: :promise 对 象 关 联 的 异步 结果 的 所 有 权 转 移 到 另 一 个 对 象 中 。 
声明 
promise& operator= (promise&& other) noexcept; 
结果 
将 关联 至 other 的 异步 结果 的 所 有 权 转 移 给 *this。 如 果 *this 已 经 有 了 相关 联 


的 异步 结果 ， 该 异步 结果 变 为 就 绕 ， 带 有 sti::future errc::broken promise 
错误 码 的 std: :future_error 类 型 的 异常 。 
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后 置 条 件 

在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std: :future XÆ, other 没有 关联 异步 结果 。 

返回 
*this 

引发 

无 。 


std::promise::swap 成 员 函 数 
交换 关联 至 两 个 std: :promise 对 象 的 异步 结果 的 所 有 权 。 


声明 
void swap(promise& other); 

结果 

交换 关联 至 other 和 *this 的 异步 结果 的 所 有 权 。 

后 置 条 件 

在 调用 swap 之 前 关联 至 other 的 异步 结果 和 任务 (WRA) 现在 关联 至 *this。 
在 调用 swap 之 前 关联 至 *this 的 异步 结果 和 任务 (如 果 有 ) 现在 关联 至 other。 

引发 

无 。 


std::promise 析 构 函数 
销毁 std: :promise 对 象 。 
声明 
-promise(); 
结果 
销毁 *this。 如 果 *this 拥有 关联 的 异步 结果 ， 且 该 结果 没有 存储 任务 或 异常 ， 那 


人 么 此 结果 变 成 就 绪 ， 带 有 std::future errc::broken promise 错误 码 的 
std::future error 异常 。 


引发 
"NIS 


std::promise::get future 成 员 函 数 
为 关联 至 *this 的 异步 结果 获取 std: : future 实例 。 
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声明 


std::future<ResultType> get future(); 


前 置 条 件 

*this 拥有 关联 的 异步 结果 。 

返回 

针对 关联 至 *this 的 异步 结果 的 std: :future 实例 。 

引发 

如 果 std::future 已 经 在 之 前 通过 调用 get_future () 获取 过 了 ， 引 发 带 有 
std::future errc::future already retrieved 错误 码 的 std::future_ 


error 类 型 的 异常 。 
std::promise::set_value 成 员 函 数 


将 一 个 值 存储 在 与 *this 相关 联 的 异步 结果 中 。 
= 
声明 

void promise«void»::set Value () ; 

void promise«R&»::set value(R& r); 


void promise«R»::set value(R const& r); 
void promise<R>::set_value(R&& r); 


前 置 条 件 

*this 拥有 关联 的 异步 任务 。 

结果 

如 果 ResultType 不 是 void， 就 将 工 存 储 在 与 *this 关联 的 异步 结果 中 。 

后 置 条 件 

关联 至 *this 的 异步 结果 就 绪 , 带 有 存储 的 值 。 所 有 等 待 异步 结果 的 被 阻塞 线程 全 
部 解除 阻塞 。 

引发 

如 果 异 步 结果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 带 有 std::future errc:: 
promise already satisfied 错误 码 的 std::future error 类 型 的 异常 。 由 工 
的 拷贝 构造 函数 或 移动 构造 函数 引发 的 所 有 异常 。 

同步 

多 个 并 发 的 set value(),set value at thread exit(),set exception() 
和 set exception at thread exit () 调用 都 是 序列 化 的 。 成 功 的 对 set value() 
进行 调用 ， 发 生 于 对 std::future<ResultType>::get() 或 std::shared_ 
future<ResultType>: :get 1() 之 前 ， 它 们 获取 已 存储 的 值 。 
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std::promise::set_value_at_thread_exit 成 员 函 数 


将 值 存储 在 与 *this 相关 联 的 异步 结果 中 , 直到 线程 结束 前 都 不 将 关联 的 异步 结果 
声明 

void promise«void»::set value at thread exit(); 

void promise«R&»::set value at thread exit(R& r); 


void promise«R»::set value at thread exit(R const& r); 
void promisecR»::set value at thread exit(R&& r); 


前 置 条 件 
*this 拥有 关联 的 异步 结果 。 
结果 


如 果 ResultType 不 是 void， 就 将 + 存储 在 关联 至 *this 的 异步 结果 中 。 将 异 
步 结果 标记 为 拥有 存储 的 值 。 调 度 关联 的 异步 结果 在 当前 线程 退出 的 时 候 变 为 就 绪 。 

后 置 条 件 

关联 至 *this 的 异步 结果 拥有 存储 的 值 ， 但 直到 当前 线程 推出 之 前 都 不 是 就 绪 的 。 
所 有 等 待 异步 结果 的 被 阻塞 线程 在 当前 线程 退出 时 全 部 解除 阻塞 。 

引发 

如 果 蜡 步 结 果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 带 有 std::future_errc:: 
promise already satisfied 错误 码 的 std::future error 类 型 的 异常 。 由 虐 
的 拷贝 构造 函数 或 移动 构造 函数 引发 的 所 有 异常 。 

同步 

多 个 并 发 的 set_value () 、 set value at thread exit(),set exception() 
和 set exception at thread exit () 调用 都 是 序列 化 的 。 成 功 的 对 set value 
at thread exit() 进行 调用 ， 发 生 于 对 std::future<ResultType>::get () zk 
std::shared future<ResultType>: :get() 之 前 ,它们 获取 已 存储 的 值 ， 


std::promise::set exception 成 员 函 数 


将 一 个 异常 存储 在 与 *this 相关 联 的 异步 结果 中 。 
声明 


void set exception(std::exception ptr e); 


前 置 条 件 

*this 拥有 关联 的 异步 任务 。 (bool) e X true, 
结果 

Tte 存储 在 与 *this 关联 的 异步 结果 中 。 
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后 置 条 件 

关联 至 *this 的 异步 结果 就 绪 , 带 有 存储 的 异常 。 所 有 等 待 异 步 结果 的 被 阻塞 线程 
全 部 解除 阻塞 。 | 

引发 

如 果 异 步 结果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 带 有 std::future_erre:: 
promise already satisfied 错误 码 的 std: :future error 类 型 的 异常 。 

同步 

多 个 并 发 的 set value(), set value at thread exit(),set exception() 
和 set exception at thread exit () 调用 都 是 序列 化 的 。 成 功 的 对 set value() 
进行 调用 , 发 生 于 对 std: : future<ResultType>: :get () X std: :shared future 
<ResultType>: :get () 之 前 ， 它 们 获取 已 存储 的 异常 。 


std::promise::set exception at thread exit 成 员 函 数 


将 异常 存储 在 与 *this 相关 联 的 异步 结果 中 , 直到 线程 结束 前 都 不 将 关联 的 异步 结 
声明 


void set exception at thread exit(std::exception ptr e); 


前 置 条 件 

*this 拥有 关联 的 异步 结果 。 (bool)e true, 

结果 

将 e 存储 在 关联 至 *this 的 异步 结果 中 。 调 度 关联 的 异步 结果 在 当前 线程 退出 的 
时 候 变 为 就 绪 。 

后 置 条 件 


关联 至 *this 的 异步 结果 拥有 存储 的 异常 ， 但 直到 当前 线程 退出 之 前 都 不 是 就 绪 
的 。 所 有 等 待 异 步 结果 的 被 阻塞 线程 在 当前 线程 退出 时 全 部 解除 阻塞 。 

引发 

如 果 蜡 步 结果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 带 有 std::future_errc: : 
promise already satisfied 错误 码 的 std: :future error 类 型 的 异常 。 

同步 

多 个 并 发 的 set value(), set value at thread exit(), set exception() 
和 set exception at thread exit () 调用 都 是 序列 化 的 。 成 功 的 对 set_exception_ 
at thread exit () 进行 调用 ， 发 生 于 对 std::futureXResultType»::get () 或 
std::shared future«ResultType»::get () 之 前 ， 它 们 获取 已 存储 的 异常 。 


440 附录 D “C++ 线程 类 库 参 考 


D.4.5 ”std::async 函数 模板 


std::async 是 一 种 利用 现成 的 硬件 并 发 来 运行 自 包含 异步 人 物 的 简单 途径 。 对 
std: :async 的 调用 返回 一 个 包含 任务 结果 的 std: : future。 取决 于 启动 策略 , 该 任 
务 可 以 异步 地 运行 在 它 自己 的 线程 上 , 也 可 以 同步 地 运行 于 任何 在 此 future 调用 wait () 
Bk get O 成 员 函 数 的 线程 上 。 

声明 


enum class launch 


( 
J 


async, deferred 


template<typename Callable,typename ... Args> 
future<result_of<Callable(Args...)>::type> 
async (Callable&& func,Args&& ... args); 
template«typename Callable,typename ... Args» 
future«result of«Callable(Args...)»::type» 
async(launch policy,Callable&& func,Args&& ... args); 
A 
前 置 条 件 


对 于 所 给 的 func 和 args 值 , 表 达 式 INVOKE (func, args) 是 有 效 地 ,Callable 
和 Args 的 所 有 成 员 都 是 MoveConstructible 的 。 

结果 

在 内 部 存储 中 构造 func 和 args.. .的 副本 (分别 记 为 fff 和 xyz...)。 

如 果 policy 是 std::launch::async, 在 其 自己 的 线程 上 运行 INVOKE 
(fff,xyz...)。 所 返回 的 std: :future 会 在 此 线程 完成 的 时 候 变 为 就 绪 ， 并 且 会 持 有 
返回 值 或 有 函数 调用 所 引发 的 异常 。 最 后 一 个 与 std::future 返回 的 异步 状态 同步 的 
future 对 象 的 析 构 函数 会 一 直 被 阻塞 到 future 就 绪 。 | 

NR policy Æ std::launch::deferred, fff Ml xyz.. .会 作为 延迟 函数 调 
用 被 存储 在 所 返回 的 scd: : future 中 ,在 共享 相同 关联 状态 的 future 上 首次 对 wait () 
或 get () 成 员 函 数 的 调用 ， 会 同步 地 在 调用 wait) R get O 的 线程 上 执行 
INVOKEX(£fÉfy;/XyZ..)g 

通过 执行 INVOKE (fff,xyz...) 所 返回 的 值 或 引发 的 异常 ， 会 从 在 该 
std::future 上 对 get O 的 调用 中 返回 。 

如 果 policy 是 std::launch::async | std::launch::deferred 或 
policy 参数 被 省 略 ， 该 行为 如 同 std::launch::async 或 std::launch:: 
deferred 之 一 被 指定 。 此 实现 会 基于 call-by-call 理论 选择 具体 行为 ， 以 便利 用 可 用 的 
硬件 并 发 且 没 有 超 量 的 过 度 订 阅 。 
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在 所 有 情况 下 ， 对 std: :async 的 调用 立刻 返回 。 

同步 

函数 调用 的 完成 ， 发 生 于 成 功 从 在 引用 相同 关联 状态 的 std::future 或 
std::shared future 实例 上 对 wait () 、get() 、wait for()9k wait until() 
的 调用 中 返回 之 前 ， 如 std::future XRM std::async 的 调用 中 返回 。 在 
std::launch::async 的 policy 情况 下 , 函数 调用 所 在 的 线程 的 完成 同样 发 生 于 成 
功 从 这 些 调用 返回 之 前 。 

引发 

如 果 无 法 分 配 所 需 的 内 部 存储 ， 引 发 std: :bad_alloc 异常 ， 否 则 当 无 法 达成 结 
果 或 在 构造 fff 和 xyz.. .时 引发 了 任何 的 异常 ,就 引发 std::future error 异常 。 


«mutex» 3. x 4t 


<mutex> 头 文件 提供 了 担保 互 斥 的 功能 : 互 斥 元 类 型 、 锁 类 型 和 函数 ， 以 及 确保 一 
项 操作 恰好 被 执行 一 次 的 机 制 。 
头 文件 内 容 


namespace std 
class mutex; 
class recursive mutex; 
class timed mutex; 
class recursive timed mutex; 


struct adopt lock t; 
struct defer lock t; 
struct try to lock t; 


constexpr adopt lock t adopt lock(]; 
constexpr defer lock t defer lock{}; 
constexpr try to lock t try to lock(); 
template«typename LockableType» 

class lock guard; 


template<typename LockableType> 
class unique_lock; 


template<typename LockableTypel, typename... LockableType2> 
void lock (LockableTypel& m1,LockableType2& m2...); 


template<typename LockableTypel, typename... LockableType2> 
int try lock(LockableTypel& m1,LockableType2& m2...) ; 


struct once_flag; 


template<typename Callable,typename... Args> 
void call once(once flag& flag,Callable func,Args args...); 
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D.5.1 std::mutex 类 


std: :mutex 类 为 线程 提供 了 基本 的 互 斥 与 同步 机 制 ， 可 用 来 保护 共享 数据 。 在 访 
问 互 斥 元 所 保护 的 数据 之 前 ， 该 互 斥 元 必须 通过 调用 Lock () 或 try_lock() 来 锁定 。 
在 同一 时 刻 仅 有 一 个 线程 可 以 持 有 这 个 锁 ， 如 果 另 一 个 线程 也 试图 锁定 此 互 斥 元 ， 就 会 
失败 或 被 适当 地 阻塞 。 一 旦 线程 完成 了 访问 共享 数据 ， 它 必须 接着 调用 unlock () 来 释 
放 锁 ， 并 人 允许 其 他 线程 获得 它 。 

std: :mutex 满足 Lockable 的 需求 。 

类 定义 
class mutex 


( 
public: 
mutex (mutex const&)-delete; 
mutex& operator= (mutex const&)=delete; 


constexpr mutex() noexcept; 
^mutex(); 


void lock(); 
void unlock(); 
bool try lock(); 


) 
std::mutex 默认 构造 函数 
构造 std: :mutex WR, 
声明 
constexpr mutex() noexcept; 
结果 
构造 std: :mutex 实例 。 
后 置 条 件 
新 构造 的 std: :mutex 对 象 初始 是 未 锁定 的 。 
抛 出 
Jós 
std::mutex 析 构 函数 
销毁 std: :mutex 对 象 。 
声明 


~mutex () ; 
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前 置 条 件 

*this 不 得 被 锁定 。 
结果 

销毁 *this。 

抛 出 

X. 


std::mutex::lock 成 员 函 数 
为 当前 线程 获取 在 std: :mutex 对 象 上 的 锁 。 


声明 
void lock(); 


前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结果 

阻塞 当前 线程 ， 直 到 能 够 获得 *this 上 的 锁 。 

后 置 条 件 

*this 被 调用 线程 锁定 。 

抛 出 

如 果 有 错误 发 生 ， 抛 出 std::system_error 类 型 的 异常 。 


std::mutex::try lock 成 员 函 数 


尝试 为 当前 线程 获取 std: :mutex 对 象 上 的 锁 。 
声明 


bool try lock(); 


前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结果 

尝试 为 调用 线程 在 非 阻塞 的 情况 下 获取 *this 上 的 锁 。 
返回 

如 果 为 调用 线程 获取 到 锁 ， 返 回 true, 否则 false, 
后 置 条 件 

如 果 函 数 返回 true， 则 *this 被 调用 线程 锁定 。 

抛 出 

无 。 
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注意 : 即使 没有 其 他 的 线程 持 有 *this 上 的 锁 ， 函 数 也 可 能 获取 锁 失 败 ( 并 返回 false). 


std::mutex::unlock 成 员 函 数 


释放 当前 线程 持 有 的 std: :mutex 对 象 上 的 锁 。 
声明 


void unlock(); 


前 置 条 件 

调用 线程 必须 持 有 *this 上 的 锁 。 

结果 

释放 当前 线程 持 有 的 *this 上 的 锁 。 如 果 有 被 阻塞 的 线程 正 等 待 获取 *this 上 的 
锁 ， 则 对 其 解除 阻塞 。 

抛 出 

无 。 


D.5.2 std::recursive mutex 类 


std::recursive mutex 类 为 线程 提供 了 基本 的 互 斥 和 同步 机 制 , 可 用 来 保护 共 
享 数 据 。 在 访问 互 斥 元 所 保护 的 数据 之 前 ， 该 互 斥 元 必须 通过 调用 lock() 或 
try lock () 来 锁定 。 在 同一 时 刻 仅 有 一 个 线程 可 以 持 有 这 个 锁 ， 如 果 另 一 个 线程 也 试 
图 锁定 此 recuzsive_mutex， 就 会 失败 或 被 适当 地 阻塞 , 一 旦 线程 完成 了 访问 共享 数 
据 ， 它 必须 接着 调用 unlock O 来 释放 锁 ， 并 允许 其 他 线程 获得 它 。 

这 里 的 互 斥 元 是 递归 的 (recursive)， 因 此 持 有 在 特定 std::recursive mutex 
上 锁 的 线程 可 以 进一步 调用 Lock () 或 try_lock () 来 增加 锁定 计数 值 。 该 互 斥 元 不 能 
被 另外 的 线程 锁定 ， 直 到 获得 锁 的 线程 为 每 个 对 Lock () Al try_lock () 的 成 功 调用 都 
调用 过 一 次 unlock(), 

std::recursive mutex 满足 Lockable 的 需求 。 

类 定义 
class recursive mutex 


public: 
recursive mutex(recursive mutex const&)-delete; 
recursive mutex& operator- (recursive mutex const&)-delete; 


recursive mutex() noexcept; 
-recursive mutex(); 
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void lock(); 
void unlock(); 


bool try lock() noexcept; 


): 


std::recursive mutex 默认 构造 函数 


构造 std: :recutrsive mutex WR, 
"E 
声明 


recursive mutex() noexcept; 


结果 

构造 std::recursive mutex 实例 。 

后 置 条 件 

新 构造 的 std: :recursive mutex 对 象 初始 是 未 锁定 的 。 

抛 出 

如 果 不 能 创建 新 的 std::recursive mutex 实例 ， 则 抛 出 std 
error 类 型 的 异常 。 


std::recursive mutex 析 构 函数 


销毁 std::recursive mutex WR, 
声明 


-recursive mutex(); 


前 置 条 件 

*this 不 得 被 锁定 。 
结果 

销毁 *this。 

抛 出 

X. 


std::recursive mutex::lock 成 员 函 数 
为 当前 线程 获取 在 std: :recursive_mutex WR EMM, 
声明 
void lock(); 


结果 
阻塞 当前 线程 ， 直 到 能 够 获得 *this 上 的 锁 。 
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后 置 条 件 

*this 被 调用 线程 锁定 。 如 果 调 用 线程 已 经 持 有 *this 上 的 锁 ， 则 锁 计 数值 增 
加、 

抛 出 

如 果 有 错误 发 生 ， 抛 出 std: :system error 类 型 的 异常 。 


std::recursive mutex::try lock pk, 5 i 281 


尝试 为 当前 线程 获取 std::recursive mutex 对 象 上 的 锁 。 
声明 


bool try lock() noexcept; 


结果 

尝试 为 调用 线程 在 非 阻 塞 的 情况 下 获取 *this 上 的 锁 。 

返回 

如 果 为 调用 线程 获取 到 锁 ， 返 回 true, FIJ false, 

后 置 条 件 

如 果 函 数 返 回 true， 则 已 经 为 调用 线程 获取 了 新 的 *this 上 的 锁 。 
抛 出 

无 。 


注意 .如果 调 用 线程 已 经 持 有 了 *this LWS, MAAE true， 且 调用 线程 持 有 的 *this 
上 锁 的 计数 值 增加 1。 如 果 当 前 线程 并 未 持 有 *this LAM, 即使 没有 其 他 的 线程 持 有 
*this 上 的 锁 ， 函 数 也 可 能 获取 锁 失 败 (并 返回 false). 


std::recursive_mutex::unlock 成 员 函 数 


释放 当前 线程 持 有 的 std: :recursive mutex 对 象 上 的 锁 。 


声明 
void unlock(); 
前 置 条 件 
调用 线程 必须 持 有 *this 上 的 锁 。 
结果 


释放 当前 线程 持 有 的 *this 上 的 锁 。 如 果 这 是 调用 线程 所 持 有 的 最 后 一 个 *this 上 
的 锁 ， 那 么 若 有 被 阻塞 的 线程 正 等 待 获取 *this 上 的 锁 ， 则 对 其 解除 阻塞 。 

后 置 条 件 

调用 线程 持 有 的 *this 上 的 锁 的 计数 值 减 一 。 
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抛 出 
9255 


D.5.3 std::timed mutex 类 


std: :mutex 提供 了 基本 的 互 斥 与 同步 机 制 , 在 此 之 上 ， std: :timed mutex 类 
为 带 超时 的 锁 提 供 了 支持 。 在 访问 由 互 斥 元 保护 的 数据 之 前 ， 该 互 斥 元 必须 通过 调用 
lock(), try lock(), try lock for() 或 try lock until() 来 进行 锁定 。 如 
果 已 经 有 别 的 进程 持 有 了 锁 ， 那 么 试图 获取 锁 就 会 有 下 面 几 种 情况 : 失败 
(try lock() )， 阻 塞 直到 锁 能 够 被 获取 (lock () ) ， 阻 塞 直到 锁 能 被 获取 或 者 尝试 锁 
定 超 时 (try lock for () 或 try lock_until() )。 一旦 获得 了 锁 (不 管 是 用 哪个 
函数 获取 到 的 ) ， 在 其 他 线程 可 以 在 互 斥 元 上 获得 该 锁 之 前 ， 都 必须 调用 unlock () 来 
释放 它 。 

std::timed mutex 满足 TimedLockable 的 需求 。 

类 定义 
class timed mutex 


{ 
public: 
timed mutex(timed mutex const&) =delete; 
timed mutex& operator- (timed mutex const&) =delete; 


timed mutex(); 
~timed_mutex () ; 


void lock(); 
void unlock(); 
bool try lock(); 


template«typename Rep,typename Period» 
bool try lock for( 
std::chrono::duration<Rep, Period> const& relative time); 


template«typename Clock,typename Duration» 
bool try lock until( 
std::chrono::time point«Clock,Duration» const& absolute time); 


); 
std::timed_mutex 默认 构造 函数 
构造 std::timed mutex 对 象 。 
声明 
timed mutex(); 


结果 
构造 std::timed mutex 实例 。 
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后 置 条 件 

新 构造 的 std: :timed mutex 对 象 初始 是 未 锁定 的 。 

抛 出 

如 果 不 能 创建 新 的 timed mutex 实例 ， 则 抛 出 std::system error 类 型 的 异常 。 


std::timed mutex 析 构 函数 


销毁 std::timed mutex WR, 
声明 


-timed mutex(); 


前 置 条 件 

*this 不 得 被 锁定 。 
结果 

销毁 *this。 

抛 出 

无 。 


std::timed_mutex::lock KA i AX 
为 当前 线程 获取 在 std: : timed mutex 对 象 上 的 锁 。 


声明 
void lock(); 


前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结果 

阻塞 当前 线程 ， 直 到 能 够 获得 *this 上 的 锁 。 

后 置 条 件 

*this 被 调用 线程 锁定 。 

抛 出 

如 果 有 错误 发 生 ， 抛 出 std::system error 类 型 的 异常 。 


std::timed mutex::try lock A 5 ER 25 
尝试 为 当前 线程 获取 std: :mutex 对 象 上 的 锁 。 


声明 


bool try lock(); 
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前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结果 

尝试 为 调用 线程 在 非 阻塞 的 情况 下 获取 *this 上 的 锁 。 
返回 

如 果 为 调用 线程 获取 到 锁 ， 返回 true, 否则 false, 
后 置 条 件 

如 果 函 数 返回 true， 则 *this 被 调用 线程 锁定 。 

抛 出 

X. 


注意 : 即使 没有 其 他 的 线程 持 有 *this 上 的 锁 ， 函 数 也 可 能 获取 锁 失败 (并 返回 false). 


std::timed_mutex::try_lock_for Am 


尝试 为 当前 线程 获取 std::timed mutex 对 象 上 的 锁 。 
声明 


template«typename Rep,typename Period» 
bool try lock for( 
std::chrono::duration<Rep, Period> const& relative time); 


前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结果 

在 relative time 指定 的 时 间 内 ， 尝 试 为 调用 线程 获取 *this ENB. WR 
relative time.count () 为 零 或 负数 ,此 调用 会 立即 返回 ,如 同调 用 了 try_lock () 
一 样 。 否则 , 该 调用 会 一 直 阻塞 ,直到 获取 了 锁 或 者 经 过 了 relative time 所 指定 的 
时 间 段 。 

返回 

如 果 为 调用 线程 获得 了 锁 ， 返 回 true, 否则 false, 

后 置 条 件 

如 果 函 数 返 回 true， 则 *this 被 调用 线程 锁定 。 

抛 出 

无 。 


注意 : 即使 没有 其 他 的 线程 持 有 *this 上 的 锁 ， 函 数 也 可 能 获取 锁 失败 (并 返回 false), A 
程 可 能 会 比 指定 的 时 间 段 阻塞 更 长 的 时 间 。 如 果 可 能 的 话 ， 所 经 过 的 时 间 是 有 可 靠 时 钟 
来 决定 的 。 
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std::timed mutex::try lock until 成 员 函 数 
尝试 为 当前 线程 获取 std::timed mutex 对 象 上 的 锁 。 


声明 
template«typename Clock,typename Duration» 


bool try lock until( 
Std::chrono::time point«Clock,Duration» const& absolute time); 


前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结果 

在 absolute time 指定 的 时 间 之 前 ， 尝 试 为 调用 线程 获取 *this 上 的 锁 。 如 果 
人 和 人口 处 的 absolute time«-Clock::now(0O , ， 此 调用 会 立即 返回 ， 如 同调 用 了 
try lock() 一 样 。 否 则 ， 该 调用 会 一 直 阻 塞 ， 直 到 获取 了 锁 或 者 Clock: :now() 返 
回 等 于 或 晚 于 absolute time 的 时 间 。 

返回 

如 果 为 调用 线程 获得 了 锁 ， 返 回 true, FJ false, 

后 置 条 件 

如 果 函 数 返回 true， 则 *this 被 调用 线程 锁定 。 

抛 出 

35. 


注意 : 即使 没有 其 他 的 线程 持 有 *this 上 的 锁 ， 函 数 也 可 能 获取 锁 失 败 (并 返回 false) 38 
用 线程 将 会 被 阻塞 多 长 时 间 是 没有 保证 的 , 除非 函数 返回 false 然后 Clock: :now() 
返回 等 于 或 晚 于 absolute_ time 的 时 间 ， 在 这 时 线程 才能 解除 阻塞 ， 


std::timed_mutex::unlock 成 员 函 数 


释放 当前 线程 持 有 的 std::timed_ mutex 对 象 上 的 锁 。 
声明 


void unlock(); 


前 置 条 件 
调用 线程 必须 持 有 *this 上 的 锁 。 
结果 


释放 当前 线程 持 有 的 *this 上 的 锁 。 如 果 有 被 阻塞 的 线程 正 等 待 获取 *this 上 的 
锁 ， 则 对 其 解除 阻塞 。 
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后 置 条 件 

*this 不 再 被 调用 线程 锁定 。 
抛 出 

无 。 


D.5.4 std::recursive timed mutex 类 


std::recursive mutex 提供 了 基本 的 互 斥 与 同步 机 制 ， 在 此 之 上 ，std: : 
recursive timed mutex 类 为 带 超时 的 锁 提 供 了 支持 。 在 访问 由 互 斥 元 保护 的 数据 
之 前 ， 该 互 斥 元 必须 通过 调用 lock() 、try_lock()、try_lock for() 或 
try_lock_until() 来 进行 锁定 。 如 果 已 经 有 别 的 进程 持 有 了 锁 ， 那 么 试图 获取 锁 就 
会 有 下 面 几 种 情况 ， 失败 (try_lock () ) ， 阻 塞 直到 锁 能 够 被 获取 (lock()), AR 
直到 锁 能 被 获取 或 者 尝试 锁定 超时 (try lock _ for () 或 try lock until() )。 一 
旦 获得 了 锁 (不 管 是 用 哪个 函数 获取 到 的 ) ， 在 其 他 线程 可 以 在 互 斥 元 上 获得 该 锁 之 前 ， 
都 必须 调用 unlock () 来 释放 它 。 

这 里 的 互 斥 元 是 递归 的 ， 因 此 持 有 在 特定 std::recursive timed mutex 上 锁 
的 线程 可 以 通过 任意 的 锁 函 数 来 又 加 地 锁定 该 实例 。 在 其 他 线程 能 够 获取 该 实例 的 锁 之 
前 ， 所 有 现存 的 锁 都 必须 通过 调用 相应 的 unlock () 进行 释放 。 

std::recursive timed mutex 满足 TimedLockable 的 需求 。 

类 定义 
class recursive timed mutex 


public: 
recursive timed mutex(recursive timed mutex const&)-delete; 
recursive timed mutex& operator- (recursive timed mutex const&)-delete; 


recursive timed mutex(); 
-recursive timed mutex(); 


void lock(); 
void unlock(); 
bool try lock() noexcept; 


template<typename Rep,typename Period» 
bool try lock for( 
std::chrono::duration«Rep,Period» const& relative time); 


template<typename Clock,typename Duration» 
bool try lock until( 
std::chrono::time_point<Clock, Duration> const& absolute time); 


}; 
std::recursive timed mutex 默认 构造 函数 


构造 std::recursive timed mutex WR, 


452 附录 D ”C++ 线程 类 库 参考 


声明 


recursive timed mutex(); 


结果 

构造 std: :recursive timed mutex 实例 。 

后 置 条 件 

新 构造 的 std: :recursive timed mutex 对 象 初始 是 未 锁定 的 。 

抛 出 

如 果 不 能 创建 新 的 recursive timed mutex Xø, WIH sta: :System _ 
error 类 型 的 异常 。 


std::recursive timed mutex 析 构 函数 


销毁 std::recursive timed mutex WE, 
声明 


^recursive timed mutex(); 


前 置 条 件 

*this 不 得 被 锁定 。 
结果 

销毁 *this。 

抛 出 

无 。 


std::recursive_timed_mutex::lock 成 员 函 数 


为 当前 线程 获取 在 std::recursive timed mutex 对 象 上 的 锁 。 
声明 
void lock(); 
前 置 条 件 
调用 线程 不 得 持 有 *this 上 的 锁 。 
结果 
阻塞 当前 线程 ， 直 到 能 够 获得 *this 上 的 锁 。 
后 置 条 件 
*this 被 调用 线程 锁定 。 如 果 调 用 线程 已 经 持 有 *this 上 的 锁 ， 则 锁 计 数值 增加 一 。 


抛 出 
如 果 有 错误 发 生 ， 抛 出 std::system error 类 型 的 异常 。 
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std::recursive timed mutex::try lock 成 员 函 数 


尝试 为 当前 线程 获取 std: :mutex 对 象 上 的 锁 。 
声明 
bool try lock() noexcept; 


前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结果 

尝试 为 调用 线程 在 非 阻塞 的 情况 下 获取 *this 上 的 锁 。 
返回 

如 果 为 调用 线程 获取 到 锁 ， 返 回 true, FA false, 
后 置 条 件 

如 果 函 数 返 回 tzue， 则 *this 被 调用 线程 锁定 。 

抛 出 

无 。 


注意 : 如 果 调 用 线程 已 经 持 有 了 *this 上 的 锁 ， 函 数 返回 true， 且 调用 线程 持 有 的 *this 
上 锁 的 计数 值 增 加 一 。 如 果 当 前 线程 并 未 持 有 *this 上 的 锁 ， 即 使 没有 其 他 的 线程 持 
有 *this 上 的 锁 ， 函 数 也 可 能 获取 锁 失 败 ( 并 返回 false). 


std::recursive timed mutex::try lock for 成 员 函 数 


尝试 为 当前 线程 获取 std: :timed mutex 对 象 上 的 锁 。 
声明 
template<typename Rep,typename Period> 


bool try_lock_for ( 
std: :chrono::duration<Rep, Period> const& relative time); 


前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结果 

在 relative time 指定 的 时 间 内 ， 尝 试 为 调用 线程 获取 *this 上 的 锁 。 如 果 
relative time.count () 为 零 或 负数 ,此 调用 会 立即 返回 ,如 同调 用 了 try_lock () 
一 样 。 否 则 ,该 调用 会 一 直 阻 塞 ， 直 到 获取 了 锁 或 者 经 过 了 relative time 所 指定 的 
时 间 段 。 

返回 

如 果 为 调用 线程 获得 了 锁 ， 返 回 true， 否 则 false, 
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后 置 条 件 

如 果 函 数 返 回 true， 则 *this 被 调用 线程 锁定 。 
抛 出 

IX. 


ER: 即使 没有 其 他 的 线程 持 有 *this 上 的 锁 ， 函 数 也 可 能 获取 锁 失 败 (并 返回 false), & 
程 可 能 会 比 指定 的 时 间 段 阻塞 更 长 的 时 间 。 如 果 可 能 的 话 ， 所 经 过 的 时 间 是 有 可 靠 时 钟 
来 决定 的 。 


std::recursive timed mutex::try lock until px 5i e 2 


尝试 为 当前 线程 获取 std: :timed mutex 对 象 上 的 锁 。 
声明 
template«typename Clock,typename Duration» 


bool try lock until( 
Std::chrono::time point«Clock,Duration» const& absolute time); 


前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结果 

在 absolute time 指定 的 时 间 之 前 ， 尝 试 为 调用 线程 获取 *this 上 的 锁 。 如 果 
入口 处 的 absolute time<=Clock: :now() ， 此 调用 会 立即 返回 ， 如 同调 用 了 
try lock() 一 样 。 否 则 ， 该 调用 会 一 直 阻 塞 ， 直 到 获取 了 锁 或 者 Clock: :now () 返 
回 等 于 或 晚 于 absolute time 的 时 间 。 

返回 

如 果 为 调用 线程 获得 了 锁 ， RE true, FJ false, 

后 置 条 件 

如 果 函 数 返 回 true, W]*tnis 被 调用 线程 锁定 。 

抛 出 

TG. 


注意 : 即使 没有 其 他 的 线程 持 有 *this 上 的 锁 ， 函数 也 可 能 获取 锁 失 败 (并 返回 false), 调 
用 线程 将 会 被 阻塞 多 长 时 间 是 没有 保证 的 ， 除非 函数 返回 false 然后 Clock: :now() 
返回 等 于 或 晚 于 absolute time 的 时 间 ， 在 这 时 线程 才能 解除 阻塞 。 


std::recursive timed mutex::unlock 成 员 函 数 


PA AEA std: :timed mutex 对 象 上 的 锁 。 
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声明 
void unlock(); 


前 置 条 件 

调用 线程 必须 持 有 *this 上 的 锁 。 

结果 

释放 当前 线程 持 有 的 *this 上 的 锁 。 如 果 有 被 阻塞 的 线程 正 等 待 获取 *this 上 的 
则 对 其 解除 阻塞 。 

后 置 条 件 

*this 不 再 被 调用 线程 锁定 。 

抛 出 

无 。 


D.5.5 std::lock guard 类 模板 


std::lock guard 类 模板 提供 了 基本 的 锁 所 有 权 包 装 。 将 要 被 锁定 的 互 斥 元 类 型 
由 模板 参数 Mutex 指定 ， 且 必须 满足 Lockable 需求 。 指 定 的 互 斥 元 被 锁定 于 构造 函 
数 中 ， 并 被 解锁 于 析 构 函数 中 。 这 就 提供 了 一 个 简单 的 为 一 段 代码 块 锁定 一 个 互 斥 元 的 
方法 ， 并 且 确 保 当 离开 代码 块 的 时 候 互 斥 元 被 解锁 ， 无 论 是 一 次 性 执行 到 底 ， 还 是 使 用 
诸如 break 或 return 这 样 的 控制 流 语句 ， 或 是 引发 异常 来 达成 的 情况 。 

std::lock guard 的 实例 不 是 MoveConstructible、CopyConsstructible 
或 CopyAssignable 的 。 

类 定义 
template <class Mutex> 


class lock guard 


{ 
public: 
typedef Mutex mutex_type; 


锁 


explicit lock guard(mutex type& m); 
lock guard(mutex type& m, adopt lock t); 


-lock guard(); 
lock guard(lock guard const& ) = delete; 
lock guard& operator-(lock guard const& ) - delete; 


}; 
std::lock guard 锁定 构造 函数 


构造 锁定 所 给 互 斥 元 的 std::lock guard 实例 。 
声明 


explicit lock guard(mutex type& m); 


456 附录 D C++ 线程 类 库 参考 


结果 

构造 引用 所 给 互 斥 元 的 std: :lock_guard 实例 。 调 用 m. lock ()。 
引发 

由 m.1lock() 引 发 的 任何 异常 。 

后 置 条 件 

*this 拥有 在 m 上 的 锁 。 


std::lock_guard 采纳 锁定 构造 函数 


构造 拥有 所 给 互 斥 元 上 锁 的 std: :lock_guard 实例 。 
声明 


lock guard(mutex type& m,std: adopt lock t); 


前 置 条 件 

调用 线程 必须 拥有 在 m 上 的 锁 。 

结果 

构造 引用 所 给 互 斥 元 的 std::lock guard 实例 ， 并 获取 调用 线程 所 持 有 的 m 上 
的 锁 的 所 有 权 。 

引发 

无 。 
后 置 条 件 
*this 拥有 调用 线程 持 有 的 在 m 上 的 锁 。 


std::lock_guard 析 构 函数 
销毁 std::lock guard 实例 并 解锁 相应 的 互 斥 元 。 
声明 
-lock guard(); 
结果 
为 *this 构造 时 所 提供 的 互 斥 元 实例 m 调 用 m.unlock () , 


引发 
无 。 


D.5.6 std::unique lock 类 模板 


std::unique lock 类 模板 提供 了 比 std: :1ock guard 更 通用 的 锁 所 有 权 包 装 。 将 
要 被 锁定 的 互 斥 元 类 型 由 模板 参数 Mutex 指定 ， 且 必须 满足 BasicLockable 需求 。 一 般 
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来 说 ， 指 定 的 互 斥 元 在 构造 函数 中 被 锁定 并 在 析 构 函数 中 被 解锁 ， 尽 管 可 以 提供 额外 的 构造 
函数 和 成 员 函 数 来 允许 其 他 的 可 能 性 。 这 就 提供 了 一 个 简单 的 为 一 段 代码 块 锁定 一 个 互 斥 元 
的 方法 , 并且 确保 当 离开 代码 块 的 时 候 互 斥 元 被 解锁 , 无 论 是 运行 到 底 , 还 是 使 用 诸如 break 
或 return 这 样 的 控制 流 语句 ， 或 是 引发 异常 来 达成 的 。std: :condition variable 的 
等 待 函 数 要 求 一 个 std: :unique lock< stqd: :mutex> 的 实例 ， 并 且 std::unique_ 
lock 的 所 有 实例 化 都 适合 与 std:: condition variable any 等 待 函数 的 Lockable 
参数 一 起 使 用 。 

如 果 所 给 的 Mutex 类 型 满足 Lockable 需求 ,那么 std: :unique lock<Mutex> 
也 满足 Leckable 需求 。 如 果 在 此 之 外 ， 所 给 的 Mutex 类 型 满足 TimedLockable 需 
求 ， 那 么 std: :unique lock<Mutex> 也 满足 TimedLockable 需求 。 

”std: :unique lock 的 实例 是 MoveConstructible fll MoveAssignable ff, 

但 不 是 CopyConsstructible 或 CopyAssignable BJ, 

类 定义 
template <class Mutex> 


class unique lock 


{ 
public: 
typedef Mutex mutex type; 


unique lock() noexcept; 

explicit unique lock(mutex type& m); 

unique lock(mutex type& m, adopt lock t); 

unique lock(mutex type& m, defer lock t) noexcept; 
unique lock(mutex type& m, try to lock t); 


template<typename Clock,typename Duration» 
unique lock( 
mutex type& m, 
std::chrono::time_point<Clock,Duration> const& absolute time); 


template<typename Rep,typename Period> 
unique_lock ( 
mutex_type& m, 
std: ;chrono: :duration<Rep, Period> const& relative time); 


^unique lock(); 


unique lock(unique lock const& ) - delete; 
unique lock& operator-(unique lock const& ) = delete; 


unique lock(unique lock&& ); 
unique lock& operator-(unique lock&& ); 


void swap(unique lock& other) noexcept; 


void lock(); 
bool try lock(); 
template<typename Rep, typename Period> 
bool try lock for( 
std::chrono::duration«Rep,Period» const& relative time); 


458 


附录 D ”C++ 线程 类 库 参 考 


template<typename Clock, typename Duration» 
bool try_lock_until ( 

Std::chrono::time point«Clock,Duration» const& absolute time); 
void unlock(); 


explicit operator bool() const noexcept; 
bool owns lock() const noexcept; 

Mutex* mutex() const noexcept; 

Mutex* release() noexcept; 


m 


std::unique lock 默认 构造 函数 


构造 没有 相关 联 互 斥 元 的 std: :unique lock 实例 。 
声明 

unique lock() noexcept; 
结果 
构造 没有 相关 联 互 斥 元 的 std: :unique lock 实例 。 
后 置 条 件 


this->mutex()==NULL, this-»owns lock()--false. 


std::unique lock 锁定 构造 函数 


构造 锁定 所 给 互 斥 元 的 std::unique lock 实例 。 
声明 
explicit unique lock(mutex type& m); 
结果 
构造 引用 所 给 互 斥 元 的 std::unique _ lock 实例。 调用 m,.lock() 。 
后 置 条 件 


this->owns_lock()==true, this-»mutex()--&m. 


Std::unique lock 采纳 锁定 构造 函数 


构造 拥有 所 给 互 斥 元 上 锁 的 std: unique lock 实例 。 
声明 


unique lock(mutex type& m,std::adopt lock t); 


前 置 条 件 
调用 线程 必须 拥有 在 m 上 的 锁 。 
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结果 
构造 引用 所 给 互 斥 元 的 std::unique lock 实例 , 并 获取 调用 线程 所 持 有 的 mm 上 


的 锁 的 所 有 权 。 
引发 
无 。 
后 置 条 件 


this->owns_lock()==true, this->mutex()==&m. 
std::unique_lock 延迟 锁定 构造 函数 
构造 不 拥有 所 给 互 斥 元 上 锁 的 std: :unique lock 实例 。 


声明 

unique lock(mutex type& m,std::defer lock t) noexcept; 
结果 
构造 引用 所 给 互 斥 元 的 std: :unique lock 实例 。 
引发 
无 。 
后 置 条 件 

this-»owns lock()--false, this-»mutex()--&m. 


std::unique lock 尝试 锁定 构造 函数 
构造 与 所 给 互 斥 元 相关 联 的 std: :unique_lock 实例 ， 并 尝试 获取 该 互 斥 元 
上 的 锁 。 
声明 
unique lock(mutex type& m,std::try to lock t); 
前 置 条 件 
用 来 实例 化 std: :unique lock 的 Mutex 类 型 必须 满足 Lockable 需求 。 
结果 
构造 引用 所 给 互 斥 元 的 std: :unique_lock 实例 。 调 用 m.try_lock()。 
引发 
无 


后 置 条 件 
this-»owns lock() 返 回调 用 m.try_ lock() 的 结果 , this-»mutex()--&m, 
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std::unique lock 带 有 超时 时 间 段 的 尝试 锁定 构造 函数 
构造 与 所 给 互 斥 元 相关 联 的 std: :unique lock 实例 , 并 尝试 获取 该 互 斥 元 上 的 锁 。 
声明 
template<typename Rep,typename Period» 
unique lock( 


mutex type& m, 
std::chrono::duration«Rep,Period» const& relative time); 


前 置 条 件 

用 来 实例 化 std: :unique lock 的 Mutex 类 型 必须 满足 TimedLockable 需求 。 

结果 

构造 引用 所 给 互 斥 元 的 std::unique lock 实例 。 调 用 m.try lock for 
(relative time), 

引发 
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后 置 条 件 
this-»owns lock () 返 回调 用 m.try lock for () 的 结果 ,this->mutex () ==4m, 


std::unique lock 带 有 超时 时 间 点 的 党 试 锁定 构造 函数 
构造 与 所 给 互 斥 元 相关 联 的 std: :unique lock 实例 , 并 尝试 获取 该 互 斥 元 上 的 
锁 。 
声明 


template«typename Clock,typename Duration» 
unique lock( 


mutex type& m, 
std::chrono::time point«Clock,Duration» const& absolute time); 


前 置 条 件 

用 来 实例 化 std: :unique lock 的 Mutex 类 型 必须 满足 TimedLockable 需求 。 

结果 

构造 引用 所 给 互 斥 元 的 std::unique lock 实例 。 调 用 m.try lock until 
(absolute time) 。 

引发 

Zo 


后 置 条 件 
this->owns_lock() 返回 调用 m.try lock until() 的 结果 ，this-> 


mutex () ==&m。 
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std::unique lock 移动 构造 函数 


将 锁 的 所 有 权 从 一 个 std::unique lock 对 象 转移 到 新 创建 的 std: :unique_ 
lock 对 象 。 

声明 
unique lock(unique lock&& other) noexcept; 


结果 

构造 std::unique lock 实例 。 如 果 other 在 调用 构造 函数 前 拥有 互 斥 元 上 的 
锁 ， 该 锁 现 在 由 新 建立 的 std: :unique lock 对 象 所 有 。 

后 置 条 件 

对 于 新 构造 的 std: :unique_ lock 对 象 x,x.mutex () 等 于 调用 该 构造 函数 前 的 
other.mutex () 值 , 且 x.owns lock () 等 于 调用 该 构造 函数 前 other .owns_lock () 
的 值 。other.mutex()==NULL, other.owns lock()--false, 

引发 

无 。 


注 std::unique lock 对 象 不 是 CopyConstructible 的 ， 所 有 没有 拷贝 构造 函数 ， 只 
有 这 个 移动 构造 函数 。 


std::unique lock 移动 赋值 运算 符 


将 锁 的 所 有 权 从 一 个 std::unique lock 对 象 转移 到 男 一 个 
std::unique lock 对 象 。 

声明 
unique lock& operator- (unique lock&& other) noexcept; 


结果 

如 果 this-»owns lock () 在 此 调用 前 返回 true, HH this-»unlock, WÈ 
other 在 此 赋值 之 前 拥有 在 互 斥 元 上 的 锁 ， 该 锁 现 在 由 *this 所 有 。 

后 置 条 件 

this->mutex () 等 于 调用 此 赋值 前 的 other.mutex () 值 ， 且 this->owns_ 
lock () 等 于 调用 此 赋值 前 other.owns lockO0 Bjfü, other.mutex()--NULL, 
other.owns lock()--false, 

引发 

无 。 
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ik std::unique lock 对 象 不 是 CopyConstructible 的 ， 所 有 没有 拷贝 赋值 运算 符 ， 
只 有 这 个 移动 赋值 运算 符 . 


std::unique lock 析 构 函数 


销毁 std::unique lock 实例 并 解锁 相应 的 互 斥 元 ， 如 果 它 由 被 销 筑 的 实例 
所 持 有 。 

声明 
-unique lock(); 

结果 

如 果 this->owns_lock() 返 回 true， 调 用 this->mutex()->unlock() 。 

引发 

无 。 


std::unique_lock::swap 成 员 函 数 


在 两 个 std::unique lock 对 象 之 间 交 换 它们 相关 联 的 unique lock 的 所 
有 权 。 

声明 
void swap(unique lock& other) noexcept; 

结果 

WR other 在 调用 之 前 拥有 互 斥 元 上 的 锁 ， 该 锁 现在 由 *this 所 有 。 

如 果 *this 在 调用 之 前 拥有 互 斥 元 上 的 锁 ， 该 锁 现在 由 other 所 有 。 

后 置 条 件 

this-»mutex () 与 调用 前 other .mutex () 的 值 相 等 。other .mutex () 与 调用 
前 this->mutex() 的 值 相等 this->owns_lock () 与 调用 前 other .owns lock () 
的 值 相等 。other .owns_1lock () 与 调用 前 this->owns lock () 的 值 相等 。 

引发 

无 。 


swap 非 成 员 函 数 


在 两 个 std::unique lock 对 象 之 间 交 换 它们 相关 联 的 unique lock 的 所 
有 权 。 
声明 


void swap(unique lock& lhs,unique lock& rhs) noexcept; 
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结果 


lhs.swap(rhs) 


引发 
无 。 
std::unique lock::lock AK F A% 
获取 与 *this 相关 联 的 互 斥 元 上 的 锁 。 
声明 
void lock(); 
前 置 条 件 
this-»mutex()!-NULL, this-»owns lock()--false, 
结果 
调用 this->mutex()->1Lock() 。 
引发 


任何 由 this->mutex() ->lock() 引发 的 异常 。 如 果 this->mutex ()==NULL, 
引发 带 有 std::errc::operation not permitted 错误 码 的 std::system_ 
error 异常 。 如 果 在 条 目 上 this->owns lock()==true， 引 发 带 有 std::errc:: 
resource deadlock would occur 错误 码 的 std::system_error 异常 。 


后 置 条 件 


this-»owns lock()--true, 
std::unique lock::try lock p 5 E 3 
试图 获取 与 *this 相关 联 的 互 斥 元 上 的 锁 。 


声明 


bool try lock(); 


前 置 条 件 

用 来 实例 化 std::unique lock 的 Mutex 类 型 必须 满足 Lockable 需求 。 
this-»mutex() !=NULL, this-»owns lock()--false, 

结果 

调用 this-»mutex()-»5try lock() 。 

返回 


如 果 对 this_mutex() ->try_lock() 的 调用 返回 true， 则 返回 true, Fil 


false, 
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引发 
任何 由 this->mutex()->try_lock() 引发 的 异常 。 如 果 this->mutex () == 


NULL ， 引 发 带 有 std::errc::operation not permitted 错误 码 的 std:: 
system error 异常 。 如 果 在 条 目 上 this-»owns lock()--true, ， 引 发 带 有 


std::errc::resource deadlock would occur 错误 码 的 std::system error 


异常 。 


后 置 条 件 
on FR PK BGK |] true ，this->owns lock()--true, Fill this->owns_ 


lock ()==false, 
std::unique_lock::unlock 成 员 函 数 
释放 与 *this 相关 联 的 互 斥 元 上 的 锁 。 
声明 


void unlock(); 


前 置 条 件 
this-»mutex()!-NULL, this->owns lock()--true, 
结果 

调用 this->mutex()->unlock() 。 

引发 


任何 由 this->mutex() ->unlock() 引发 的 异常 。 如 果 在 条 目 上 this-»owns 
lock()==false ， 引 发 带 有 std::errc::operation not permitted 错误 码 的 
std::system error 异常 。 

后 置 条 件 


this-»owns lock()--false, 


std::unique lock::try lock for AK fa ER Zi 
在 指定 时 间 内 试图 获取 与 *this 相关 联 的 互 斥 元 上 的 锁 。 
声明 
template«typename Rep, typename Period» 


bool try lock for( 
std::chrono: :duration<Rep, Period> const& relative time); 


前 置 条 件 
用 来 实例 化 std: :unique lock 的 Mutex 类 型 必须 满足 Lockable 需求 。 


this-»mutex() !=NULL, this->owns lock()--false, 
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结果 

调用 this-»mutex()-»try lock for (relative time), 

返回 

如 果 对 this mutex()-»try lock for() 的 调用 返回 true, 则 返回 true, 否 
则 false。 

引发 

任何 由 this->mutex()->try_lock for() 引 发 的 异常 。 如 果 this-»mutex () == 
NULL， 引 发 带 有 std: :errc: :operation not permitted 错误 码 的 std: :system_ 
error 异常 。 如 果 在 条 目 上 this-»owns lock()--true, 引发 带 有 std: :errc:: 
resource deadlock would occur 错误 码 的 std: :system error 异常 。 

后 置 条 件 

如 果 函 数 返 回 true, this-»owns lock()--true, 18 则 this-»owns 
lock()==false, 


std::unique_lock::try_lock_until 成 员 函 数 


在 指定 时 间 内 试图 获取 与 *this 相关 联 的 互 斥 元 上 的 锁 。 
声明 


template«typename Clock, typename Duration» 
bool try lock until( 
std::chrono: :time_point<Clock, Duration> const& absolute_time) ; 


前 置 条 件 

用 来 实例 化 std::unique lock 的 Mutex 类 型 必须 满足 Lockable 需求 。 
this->mutex() !=NULL，this->owns lock()--false, 

结果 

调用 this->mutex()->try_ lock until(absolute time), 

返回 

如 果 对 this mutex()-»try lock until () 的 调用 返回 true, 则 返回 true, 
否则 false, 

引发 

任何 由 this->mutex()->try lock until() 引发 的 异常 ,如 果 this->mutex () == 
NULL, B| RHA std::errc::operation not permitted 错误 码 的 std: :system_ 
error 异常 。 如 果 在 条 目 上 this-»owns lock()--true, 引发 带 有 std::errc:: 
resource deadlock would occur 错误 码 的 std::system error 异常 。 


后 置 条 件 
hy pK BIR GH] true, this-»owns lock()--true, 否则 this->owns_ 
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lock()--false, 
std::unique lock::operator bool 成 员 函 数 


检查 *this 是 否 拥有 互 斥 元 上 的 锁 。 
声明 
explicit operator bool() const noexcept; 
返回 
this-»owns lock(), 
引发 
ik 这 是 运算 符 的 explicit 版 本 ， 因 此 它 仅 仅 在 结果 被 用 作 布尔 量 且 不 会 被 视 为 整 型 值 0 
或 1 的 上 下 文中 才 会 被 隐 式 地 调用 。 


std::unique_lock::owns_lock 成 员 函 数 


检查 *this 是 否 拥有 互 斥 元 上 的 锁 。 
声明 
bool owns lock() const noexcept; 
返回 
如 果 *this 拥有 互 斥 元 上 的 锁 ， 返 回 true, 否则 false, 
引发 
Fi 
std::unique_lock::mutex 成 员 函 数 


返回 与 *this 相关 联 的 互 斥 元 ， 如 果 有 的 话 。 
声明 


mutex type* mutex() const noexcept; 
返回 
如 果 *this 有 相关 联 的 互 斥 元 ， 返 回 指向 它 的 指针 ， 否 则 返回 NULL, 
引发 
无 。 
std::unique lock::release 成 员 函 数 


返回 与 *this 相关 联 的 互 斥 元， 如 果 有 的 话 ， 并 且 释 放 该 关联 。 
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声明 
mutex type* release() noexcept; 
结果 
断 开 互 斥 元 与 *this 的 关联 ， 并 不 解锁 持 有 的 任何 锁 。 
返回 
如 果 *this 有 相关 联 的 互 斥 元 ， 返 回 指向 它 的 指针 ， 和 否则 返回 NULL, 
后 置 条 件 
this-»mutex()--NULL, this->owns_lock()==false, 
引发 
无 。 


it 如 果 this->owns_lock() 在 调用 前 返回 true， 调 用 者 现在 对 解锁 该 互 斥 元 负责 。 


D.5.7 std::lock 函数 模板 


std::lock 函数 模板 提供 了 同时 锁定 多 于 一 个 互 斥 元 的 方法 ， 避 免 了 在 不 一 致 的 
锁 顺 序 下 的 死 锁 结果 风险 。 
声明 


template<typename LockableTypel,typename... LockableType2> 
void lock (LockableTypel& m1,LockableType2& m2...) ; 


前 置 条 件 
所 给 的 可 锁定 对 象 LockableTypel, LockableType2 等 类 型 必须 满足 


Lockable 需求 。 

结果 

在 每 个 所 给 的 可 锁定 对 象 m1 m2 等 上 获取 锁 ， 通 过 未 指定 的 顺序 来 调用 那些 类 型 
的 lock(), try lock () 和 unlock () 来 避免 死 锁 。 


后 置 条 件 
当前 线程 拥有 每 个 所 给 顶 的 可 锁定 对 象 上 的 锁 。 


引发 
调用 lock(), 、try_lock() 和 unlock() 时 引发 的 任何 异常 。 


注 如 果 蜡 常 从 std::lock 的 调用 中 传播 出 来 ， 那 么 在 本 函数 中 所 有 已 经 通过 调用 lock 0 
X try lock O 获取 锁 的 对 象 m1、m2 等 ， 都 必须 为 其 调用 unlock () 。 


D.5.8 std::try lock 函数 模板 
std::try lock 函数 模板 允许 你 尝试 着 一 次 性 锁定 一 系列 的 可 锁定 对 象 ， 因 此 它 
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们 可 能 全 都 被 锁定 也 可 能 都 没有 被 锁定 。 
声明 


template<typename LockableTypel,typename... LockableType2> 
int try lock(LockableTypel& ml,LockableType2& m2...) ; 


前 置 条 件 

所 给 的 可 锁定 对 象 LockableTypel, LockableType2 等 类 型 必须 满足 
Lockable 需求 。 

结果 

尝试 在 每 个 所 给 的 可 锁定 对 象 ml m2 FERRA, 通过 逐个 轮流 调用 
try_lock () 。 如 果 一 个 对 try lock O 的 调用 返回 false 或 引发 异常 ， 已 经 获取 的 
锁 通 过 在 对 应 的 可 锁定 对 象 上 调用 unlock () 来 释放 。 

返回 

如 果 所 有 的 锁 都 获取 到 (每 次 调用 try lock () 都 返回 ee) 返回 -1， 否则 返 
回调 用 try_lock () 返回 false 的 对 象 的 基于 零 的 索引 。 

后 置 条 件 

如 果 函 数 返 回 -1， 当 前 线程 拥有 每 个 所 提供 的 可 锁定 对 象 上 的 锁 。 否 则 , 该 调用 所 
有 已 获取 的 锁 都 已 被 释放 。 

引发 

JH try lock O 时 引发 的 任何 异常 。 


注 如果 异常 从 std::try lock 的 调用 中 传播 出 来 ， 那 么 在 本 函数 中 所 有 已 经 通过 调用 
try lock O 获取 锁 的 对 象 ml、m2 等 ， 都 必须 为 其 调用 unlock () 


D.5.9 std::once flag 类 


std: :once_flag 的 实例 与 std::call once 一 起 使 用 ， 以 确保 特定 的 函数 被 严 
格 地 调用 一 次 ， 即 便 有 多 个 线程 同时 执行 调用 。 

std::once flag 的 实例 不 是 CopyConstructible, CopyAssignable, 
MoveConstructible filMoveAssignable 的 。 

类 定义 
struct once flag 


{ 


constexpr once flag() noexcept; 


once_flag(once_flag const& ) = delete; 
once_flag& operator=(once_flag const& ) = delete; 


| 
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std::once_flag 默认 构造 函数 


std: :once flag 默认 构造 函数 构造 新 的 std::once flag 实例 ， 其 状态 指示 
了 所 关联 的 函数 尚未 被 调用 。 

声明 
constexpr once flag() noexcept; 


结果 

构造 新 的 std::once flag 实例 ， 其 状态 指示 了 所 关联 的 函数 尚未 被 调用 。 因 为 
这 是 一 个 constexpr 构造 函数 ， 带 有 静态 存储 时 间 段 的 实例 作为 静态 初始 化 阶段 的 一 
部 分 被 构造 ， 这 避免 了 竞争 条 件 和 初始 化 顺序 问题 。 


D.5.10 std::call once 函数 模板 


std::call once 与 std::once flag 一 起 使 用 ， 以 确保 特定 的 函数 被 严格 地 
调用 一 次 ， 即 便 有 多 个 线程 同时 执行 调用 。 


声明 

template<typename Callable,typename... Args> 

void call once(std::once flag& flag,Callable func,Args args...) j 
at 
前 置 条 件 


对 给 定 的 func 和 args 值 ， 表 达 式 INVOKE (func, args) 有 效 。Callable 和 
Args 的 每 个 成 员 都 是 MoveConstructible 的 。 

结果 

在 同一 个 std: :once flag 对 象 上 的 std::call_once 调用 被 序列 化 。 如 果 在 
同一 个 std: :once flag 对 象 上 之 前 没有 过 有 效 的 std::call once 调用 ， 参 数 
func( 或 其 副本 ) 如 同 通 过 INVOKE (func, args) 那样 被 调用 ,并且 std: :call once 
的 调用 有 效 当 且 仅 当 func 的 调用 返回 而 无 异常 。 如 果 在 同一 个 std: :once_flag 对 
象 上 之 前 有 过 有 效 的 std: :call once, 对 std: :call once 的 调用 会 返回 而 不 执 
fT func, 

同步 

在 std::once flag 对 象 上 有 效 的 std: :call once 调用 的 完成 ， 发 生 于 在 同 
一 个 std: :once flag 对 象 上 所 有 接 下 来 的 stdq: :call_once 调用 之 前 。 

引发 

当 结果 无 法 达到 或 从 func 的 调用 中 传播 出 任何 异常 时 ， 引 发 std::system_ 


error, 
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0.6 ”<ratio> 头 文件 


<ratio> 头 文件 提供 了 对 编译 时 有 理 数 数学 运算 的 支持 。 
头 文件 内 容 


namespace std 
template«intmax t N,intmax t D=1> 
class ratio; 


// xatio arithmetic 
template «class R1, class R2» 
using ratio add - see description; 


template «class R1, class R2» 
using ratio subtract - see description; 


template «class R1, class R2» 
using ratio multiply - see description; 


template «class R1, class R2» 
using ratio divide = see description; 


// ratio comparison 
template «class R1, class R2» 
struct ratio equal; 


template «class R1, class R2» 
struct ratio not equal; 


template «class R1, class R2» 
struct ratio less; 


template «class R1, class R2» 
struct ratio less equal; 


template «class R1, class R2» 
struct ratio greater; 


template «class R1, class R2» 
Struct ratio greater equal; 


typedef ratio<1, 1000000000000000000» atto; 
typedef ratio<1, 1000000000000000> femto; 
typedef ratio<1, 1000000000000> pico; 
typedef ratio«1, 1000000000» nano; 
typedef ratio«1, 1000000» micro; 

typedef ratio«1, 1000» milli; 

typedef ratio<1, 100» centi; 

typedef ratio«1, 10» deci; 

typedef ratio«10, 1» deca; 

typedef ratio<100, 1» hecto; 

typedef ratio<1000, 1» kilo; 

typedef ratio<1000000, 1> mega; 

typedef ratio<1000000000, 1> giga; 
typedef ratio<1000000000000, 1» tera; 
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typedef ratio«1000000000000000, 1» peta; 
typedef ratio«1000000000000000000, 1» exa; 


) 


D.6.1 std::ratio 类 模板 


std::ratio 类 模板 为 编译 时 算法 提供 了 一 套 机 制 , 包括 诸如 二 分 之 一 (std: :ratio< 
1,2»). EAyZ.— (std::ratio«2,3») mud —4rz HR (std::ratio«15,43») 这 
样 的 有 理 数 值 。 在 C++ 标准 库 中 它 被 用 来 在 实例 化 std: : chrono: : duration 类 模板 时 指 
定时 间 间 隔 。 

类 定义 
template «intmax t N, intmax t D = 1» 


class ratio 


( 

public: 
typedef ratio«num, den» type; 
static constexpr intmax t num- see below; 
static constexpr intmax t den- see below; 


需求 

D 不 能 为 零 。 

描述 

num 和 den 是 分 数 N/D 约 分 到 最 简 的 分 子 和 分 母 。den KERER. WF N Al D 
符号 相同 ，num 是 正 的 ， 否则 num 是 负 的 。 

示例 
ratio«4,6»::num = 
ratio<4,6>::den = 


ratio<4,-6>::num 
ratio<4,-6>::den = 


D.6.2 std::ratio add 模板 别名 


std::ratio add 模板 别名 提供 了 在 编译 时 将 两 个 std: :ratio 值 相 加 的 机 制 ， 
使 用 有 理 数 算法 。 

定义 
template «class R1, class R2» 
using ratio add - std::ratio«see below»; 


前 置 条 件 
R1 和 R2 必须 是 std: :ratio 类 模板 的 实例 化 。 
结果 


ratio add<R1,R2> 被 定义 为 std: :ratio 实例 的 一 个 别名 ， 它 表示 了 由 R1 和 
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R2 所 代表 的 分 数 之 和 ， 如 果 它 们 的 和 可 以 没有 溢出 地 计算 出 来 。 如 果 结 果 计 算 洲 出， 
程序 就 是 病态 的 。 在 没有 算法 溢出 的 情况 下 ，std: :ratio_add<R1,R2> 应 当 拥 有 和 
std: :ratio<R1l: :num*R2::den+R2: :num*R1: :den,R1::den*R2: :den> 4# A 


的 num 和 den 值 。 

示例 
std: ratio andastor ratios osn dtdr:ratioc2,5» »::num == 11 
Std::ratio addestd::ratioe1,35, std::ratio«2,5» »::den == 15 
Std::ratio add«std::ratio«1,3», std::ratioc7,6» »::num == 3 
std::ratio add<std;iratio<l, 3s, Btd::ratio«7,6» »::den == 2 


D.6.3 std::ratio subtract 模板 别名 


std::ratio add 模板 别名 提供 了 在 编译 时 将 两 个 std: : ratio 值 相 减 的 机 制 ， 
使 用 有 理 数 算法 。 

定义 
template <class R1, class R2> 
using ratio subtract = std::ratio«see below»; 


前 置 条 件 
R1 和 R2 必须 是 std: :ratio 类 模板 的 实例 化 。 
结果 


ratio subtract<R1,R2> 被 定义 为 std: :ratio 实例 的 一 个 别名 ， 它 表示 了 由 
R1 和 R2 所 代表 的 分 数 之 差 ， 如 果 它 们 的 差 可 以 没有 洲 出 地 计算 出 来 。 如 果 结 果 计 算 洲 
出 ， 程 序 就 是 病态 的 。 在 没有 算法 溢出 的 情况 下 ，std: :ratio subtract«R1,R2» 
应 当 拥 有 和 std::ratio«R1::num*R2::den-R2: :num*R1::den,R1::den*R2:: 
den> 相 同 的 num 和 den f, 

示例 


Std::ratio subtract«std::ratio«1,3», std::raátdo«1,5» »::num == 2 
Std::ratio subtract«std::ratio«1,3», Std::ratio«1,5» »::den == 15 
std::ratio subtract«std::ratio«1;3»5, Stad Pracia Os 5::num == -5 
Std::ratio subtract«std::ratio«1,3», std::ratio<7,6> »::den == 6 


D.6.4 std::ratio multiply 模板 别名 


std::ratio multiply 模 板 别 名 提供 了 在 编译 时 将 两 个 std: :zatio 值 相 乘 的 
Dill, 使 用 有 理 数 算法 。 

定义 
template «class R1, class R2» 
using ratio multiply - std::ratio«see below»; 
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前 置 条 件 
R1 和 R2 必须 是 std: :ratio 类 模板 的 实例 化 。 
结果 


ratio_multiply<R1,R2> 被 定义 为 std: :ratio 实例 的 一 个 别名 , 它 表 示 了 由 
R1 和 R2 所 代表 的 分 数 之 积 ， 如 果 它 们 的 积 可 以 没有 溢出 地 计算 出 来 。 如 果 结 果 计算 滋 
出 ， 程 序 就 是 病态 的 。 在 没有 算法 溢出 的 情况 下 ，stq: :ratio multiply«Rl,R2» 
应 当 拥 有 和 std: :ratio<R1: :num*R2::num,R1l::den*R2::den> 相 同 的 num 和 


den 值 。 

示例 
Std::ratio multiply«std::ratio«1,3», std::ratio«2,5» >::num == 
Std::ratio multiply«std::ratio«1,3»5, Std::ratio«2,5» »::den == 15 
std::ratio_multiply<std::ratio<1,3>, std::ratio<15,7> »::num == 5 
std::ratio_multiply<std: :ratio<1,3>, std::ratio<15,7> >::den == 7 


D.6.5 std::ratio divide 模板 别名 


std::ratio divide 模板 别名 提供 了 在 编译 时 将 两 个 std: :ratio 值 相 除 的 机 
制 ， 使 用 有 理 数 算法 。 

定义 
template «class R1, class R2» 
using ratio divide = std::ratio<see below»; 


前 置 条 件 
R1 和 R2 必须 是 std: :ratio 类 模板 的 实例 化 。 
结果 


ratio multiply<R1,R2> 被 定义 为 std: : ratio 实例 的 一 个 别名 , 它 表示 了 由 RI 
和 R2 所 代表 的 分 数 相 除 的 结果 , 如 果 此 结果 可 以 没有 溢出 地 计算 出 来 。 如 果 结 果 计 算 溢出 ， 
程序 就 是 病态 的 。 在 没有 算法 溢出 的 情况 下 ，std: :ratio_divide<R1,R2> 应 当 拥 有 和 
std::ratio«R1::num*R2::den,R1::den*R2: :num> 相 同 的 num 和 den 值 。 

示例 


std::ratio divide«std::ratio«1,3», Std::ratioe2,5» »::num ss 5 
Std::ratio divide«std::ratio«1,3», Std::ratio«2,5» »::den == 6 
std::ratio_divide<std: :ratio<1,3>, std: :ratio<15,7> »::num == 7 
std::ratio_divide<std::ratio<1,3>, std::ratio«15,7» »;:den ss 45 


D.6.6 std::ratio equal 类 模板 
std::ratio equal 类 模板 提供 了 在 编译 时 比较 两 个 std::ratio 值 是 否 相等 
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的 机 制 ， 使 用 有 理 数 算法 。 


类 定义 


template «class R1, class R2» 
class ratio equal: 


[or 


Std: 
std: 
std: 
std: 


前 置 条 件 


public std::integral_constant< 
bool, (R1::num == R2::num) 


&& 


(R1::den == R2: 


R1 和 R2 必须 是 std: : ratio 类 模板 的 实例 化 。 


示例 


:ratio equal«std: 
:ratio equal«std: 
:ratio equal«std: 
:ratio equal«std: 


:ratio«1,3», 
:fatio«e1p35; 
:ratio«1,3», 
Lal Lord) oy 


std: 
std: 
std: 
std: 


D.6.7 std::ratio_not equal 类 模板 


std::ratio equal 类 模板 提供 了 在 编译 时 比较 两 个 std: :ratio 值 是 否 不 相 
等 的 机 制 ， 使 用 有 理 数 算法 。 


类 定义 


template «class R1, class R2» 


class ratio not equal: 
public Std::integral constant«bool,!ratio equal«R1,R2»::value» 


ts 


std: 
std: 
std: 
std: 


前 置 条 件 


R1 和 R2 必须 是 std: 


示例 


:ratio not equal«std: 
:ratio not equal«std: 
:ratio not equal«std: 
:ratio not equal«std: 


D.6.8 std::ratio less 类 模板 


std::ratio less 模板 提供 了 在 编译 时 比较 两 个 std::ratio 值 ， 使 用 有 理 数 


定义 


template «class R1, class R2» 
class ratio less: 


ts 


:ratio«1,3», 
iratio<1,3>, 
;Yatio<1,3>, 
:ratio<1,3>, 


tratio«2;,;6» 
:ratio«1,6» 
:ratio«2,3» 
iratio«l,35 


OM Sev 


:ratio 类 模板 的 实例 化 。 


Std::ratio«2,6» 
std::ratio<1,6> 
std::ratio<2,3> 
std::ratio<1,3> 


public std::integral_constant<bool, see below» 


:den) > 

:Value == true 
: :Value == false 
: :Value == false 
:value == true 


>::value == false 
»::Value == true 
>::value == true 
>::value == false 
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前 置 条 件 
R1 和 R2 必须 是 std: :ratio 类 模板 的 实例 化 。 
结果 


std::ratio less«R1,R2»J&EB| std::integral constant«bool, value», 


这 里 value 是 (R1::numxR2::dqen)<(R2::numxRl::den) 。 如 果 可 能 的 话 ， 其 实现 应 
使 用 避免 溢出 的 方法 来 计算 结果 。 如 果 发 生 了 溢出 ， 则 程序 就 是 病态 的 。 


示例 
std: :ratio less«std::ratio«1,3», Std::ratio«2,6» »::value == false 
std: :ratio less«std::ratio«1,6», std::ratio<1,3> >::value == true 


std::ratio_less< 
std: :ratio<999999999,1000000000>, 
std::ratio<1000000001,1000000000> >::value == true 


std: :ratio less< 
std: :ratio<1000000001,1000000000>, 
std: :ratio<999999999,1000000000> >::value == false 


D.6.9 std::ratio greater 类 模板 


std::ratio greater 模板 提供 了 在 编译 时 比较 两 个 std::ratio 值 ， 使 用 有 
定义 
template «class R1, class R2> 


class ratio greater: 
public std::integral_constant<bool, ratio_less<R2,R1>::value> 


{}; 


前 置 条 件 
R1 和 R2 必须 是 std: :ratio 类 模板 的 实例 化 。 


D.6.10 std::ratio less equal 类 模板 


std::ratio less equal 模板 提供 了 在 编译 时 比较 两 个 std: :zatio fH, 使 用 
有 理 数 算法 。 

定义 
template <class R1, class R2> 


class ratio less equal: 
public std::integral constant«bool,!ratio less«R2,R1»::value» 


ü: 


前 置 条 件 
R1 和 R2 必须 是 std: :ratio 类 模板 的 实例 化 。 


476 附录 D C++ 线程 类 库 参 考 


D.6.11 std::ratio greater equal 类 模板 


std::ratio greater equal 模板 提供 了 在 编译 时 比较 两 个 std: :ratio fi, 
使 用 有 理 数 算法 。 

定义 
template «class R1, class R2» 
class ratio greater equal: 


public std::integral_constant<bool, !ratio_less<R1,R2>::value> 


bun 


前 置 条 件 
R1 和 R2 必须 是 std: :ratio 类 模板 的 实例 化 。 


D] <thread> 头 文件 


<thread> 头 文件 提供 了 用 来 管理 和 鉴别 线程 的 服务 ， 以 及 让 当前 线程 挂 起 的 
函数 。 
头 文件 内 容 


namespace std 


( 


class thread; 


namespace this thread 


{ 


thread: :id get id() noexcept; 
void yield() noexcept; 


template<typename Rep,typename Period» 
void sleep for ( 
std::chrono::duration<Rep, Period> sleep duration); 


template<typename Clock,typename Duration> 
void sleep_until ( 
std::chrono::time_point<Clock,Duration> wake time); 


D.7.1 std::thread 类 


std: :thread 类 用 来 管理 线程 的 执行 。 它 提供 了 开始 新 线程 运行 和 等 待 线程 执行 
完毕 的 方法 ， 以 及 标识 线程 的 方法 和 其 他 管理 线程 执行 的 函数 。 
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类 定义 
class thread 


{ 
public: 
// Types 
class id; 
typedef implementation-defined native_handle_type; // optional 


// Construction and Destruction 
thread() noexcept; 
~thread () ; 


template<typename Callable,typename Args...> 
explicit thread(Callable&& func,Args&&... args); 


// Copying and Moving 
thread(thread const& other) = delete; 
thread(thread&& other) noexcept; 


thread& operator-(thread const& other) = delete; 
thread& operator- (thread&& other) noexcept; 


void swap(thread& other) noexcept; 


vould Join () + 
void detach() ; 
bool joinable() const noexcept; 


id get_id() const noexcept; 

native handle type native handle(); 

static unsigned hardware concurrency() noexcept; 
}; 
void swap(thread& lhs,thread& rhs) ; 


std::thread::id 类 


std: :thread: :id 的 实例 标识 一 个 特定 的 线程 的 执行 。 
类 定义 

class thread: :id 

{ 

public: 
id() noexcept; 


i 


bool operator--(thread::id x, thread::id y) noexcept; 
bool operator!-(thread::id x, thread::id y) noexcept; 
bool operator<(thread::id x, thread::id y) noexcept; 
bool operator«-(thread::id x, thread::id y) noexcept; 
bool operator» (thread::id x, thread::id y) noexcept; 
bool operator»-(thread::id x, thread::id y) noexcept; 


template<typename charT, typename traits» 
basic ostream«charT, traits»& 
operator«« (basic ostream«charT, traits»&& out, thread::id id); 


“a, 
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注意 : 标识 一 个 特定 的 线程 执行 的 std::thread::id 值 ， 应 该 与 默认 构造 的 
std::thread::id 实例 的 值 和 所 有 代表 其 他 线程 执行 的 值 都 不 相同 。 
对 特定 的 线程 ,std: :thread: :id 值 不 可 预测 , 并 且 可 能 在 同一 个 程序 的 每 次 执 
行 中 都 不 一 样 。 
std::thread::id 是 CopyConstructible 和 CopyAssignable fj, Alt 
std::thread::id 的 实例 可 以 自由 地 复制 和 赋值 。 
std::thread::id 默认 构造 函数 
构造 一 个 std: :thread: :id 对 和 象 并 不 表示 任何 线程 的 执行 。 
声明 
id() noexcept; 
结果 
构造 一 个 std::thread::id 实例 ， 包 括 特别 的 非 任何 线程 (not any thread) 的 值 。 


引发 
75s 


注意 : 所 有 默认 构造 的 std: :thread: : id 实例 存储 相同 的 值 . 


std::thread::id 相等 比较 运算 符 
比较 两 个 std: :thread: :id 的 实例 ， 看 它们 是 否 代 表 了 相同 的 线程 的 执行 。 


声明 
bool operator--(std::thread::id lhs,std::thread::id rhs) noexcept; 

返回 
如 果 lhs 和 rhs 都 表示 相同 的 线程 的 执行 或 者 都 有 特别 的 非 任何 线程 值 ， 返 回 
true。 如 果 lhs 和 rhs 代表 不 同 的 线程 的 执行 ， 或 者 其 中 一 个 表示 线程 的 执行 ， 另 一 
个 具有 特别 的 非 任何 线程 值 ， 返 回 false。 

引发 

I. 


std::thread::id 不 等 比较 运算 符 
比较 两 个 std: :thread: :id 的 实例 ， 看 它们 是 否 代表 了 不 同 的 线程 的 执行 。 


声明 


bool operator!-(std::thread::id lhs,std::thread::id rhs) noexcept; 
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返回 
! (lhs==rhs) 


引发 
无 。 


std::thread::id 小 于 比较 运算 符 


比较 两 个 std: :thread: :id 的 实例 , 看 其 中 一 个 是 否 在 线程 ID 值 总 排序 中 排 在 
B—P TN. 

声明 
bool operator«(std::thread::id lhs,std::thread::id rhs) noexcept; 

返回 

如 果 lhs 的 值 在 线程 ID 值 总 排序 中 出 现在 rns 的 值 之 前 ， 返 回 true, TR 
lhs!=rhs, lhs<rhs 和 rhs<lhs 中 必然 有 一 个 返回 true， 男 一 个 返回 false, 4 
果 lhs--rhs, 那么 lhs<rhs fll rhs«1hs 都 返回 false, 

引发 

无 。 


注意 : 默认 构造 的 std: :thread: :id 实例 所 具有 的 特别 的 非 任何 线程 值 ， 它 小 于 任何 代表 
了 线程 的 执行 的 std: :thread: :id 实例 。 如 果 两 个 std: :thread: :id 实例 相等 ， 
那么 谁 都 不 小 于 谁 。 任 意 一 组 不 同 的 std: :thread: :id 值 都 可 以 构成 一 个 总 排序 ， 
它 在 程序 的 执行 过 程 中 是 一 致 的 。 这 个 排序 在 同一 个 程序 的 每 次 执行 之 间 可 能 会 变化 。 


std::thread::id 小 于 或 等 于 比较 运算 符 


比较 两 个 std: : thread: :id 的 实例 , 看 其 中 一 个 是 否 在 线程 ID 值 总 排序 中 排 在 
另 一 个 之 前 或 与 之 相等 。 

声明 
bool operator«-(std::thread::id lhs,std::thread::id rhs) noexcept; 

返回 
! (rhs<lhs) 


引发 
无 。 


std::thread::id 大 于 比较 运算 符 
比较 两 个 std: :thread: :id 的 实例 , 看 其 中 一 个 是 否 在 线程 ID 值 总 排序 中 排 在 


480 附录 D C++ 线程 类 库 参 考 


D gs 
声明 


bool operator>(std::thread::id lhs,std::thread::id rhs) noexcept; 
返回 
rhs«lhs 


引发 
Tee 


std::thread::id 大 于 或 等 于 运算 符 


比较 两 个 std: :thread: :id 的 实例 , 看 其 中 一 个 是 否 在 线程 ID 值 总 排序 中 排 在 
另 一 个 之 后 或 与 之 相等 。 

声明 
bool operator»-(std::thread::id lhs,std::thread::id rhs) noexcept; 

返回 
! (lhs<rhs) 


引发 
Ju. 


std::thread::id 流 插入 运算 符 


将 表示 std: : thread: :idq 值 的 字符 串 写 到 指定 的 流 中 。 
声明 


template<typename charT, typename traits» 
basic ostream«charT, traits>& 
operator«« (basic ostream«charT, traits»&& out, thread::id id); 


结果 

将 表示 std: :thread: :id 值 的 字符 串 插入 到 指定 的 流 中 。 
返回 

out 

引发 

Ke 


注意 : 字符 串 表 示 的 格式 并 未 指定 。 相 等 的 std: :thread: :id 实例 具有 相同 的 表示 ， 不 等 
的 实例 具有 不 同 的 表示 。 
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std::thread::native handle typetypedef 


native handle type 是 一 个 到 可 用 于 特定 平台 API 类 型 的 typedef。 
声明 


typedef implementation-defined native handle type; 
ik 该 typedef 是 可 选 的 。 若 存在 ， 则 其 实现 应 当 提供 一 个 适用 于 本 地 特定 平台 API 的 类 型 ， 


std::thread::native handle fX F e 2 
返回 native handle type 类 型 的 值 ， 它 代表 着 与 *this 关联 的 执行 线程 。 
声明 


native handle type native handle(); 
注 该 函数 是 可 选 的 。 若 存在 ， 则 返回 值 应 该 适用 于 本 地 特定 平台 API, 


std::thread 默认 构造 函数 


构造 不 与 执行 线程 相关 联 的 std: :thread 对 象 。 
声明 
thread() noexcept; 
结果 
构造 std: :thread 实例 ， 它 没有 关联 的 执行 线程 。 
后 置 条 件 
对 新 构造 的 std: :thread XJZi x, x.get_id()==id(), 
引发 
无 。 


std::thread 构造 函数 
构造 与 新 的 执行 线程 相关 联 的 std: :thread 对 象 。 


声明 
template«typename Callable,typename Args...> 
explicit thread(Callable&& func,Args&&... args) ; 
前 置 条 件 


func 和 args 的 每 个 元 素 必须 是 MoveConstructible 的 。 
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结果 

构造 std::thread 实例 并 将 它 关 联 至 新 创建 的 执行 线程 。 复 制 或 移动 func 和 
args 的 每 个 元 素 到 内 部 存储 中 ， 并 持续 在 新 的 执行 线程 的 整个 生命 周期 。 在 新 的 执行 
线程 上 执行 INVOKE (copy-of-func,copy-of-args), 

后 置 条 件 

对 新 构造 的 std: :thread WH x, x.get id()!-id(), 

引发 

如 果 不 能 启动 新 线程 , 引发 std::system error 类 型 的 异常 。 将 func 或 args 
复制 进 内 部 存储 时 引发 的 任何 异常 。 

同步 

对 构造 函数 的 调用 ， 发 生 于 在 新 创建 的 执行 线程 上 执行 给 定 函 数 之 前 。 


std::thread 移动 构造 函数 


将 执行 线程 的 所 有 权 从 一 个 std: : thread 对 象 转移 到 新 创建 的 stdq:; :thread 对 
象 。 

声明 
thread(thread&& other) noexcept; 

结果 
构造 std::thread 实例 。 如 果 other 在 调用 构造 函数 之 前 拥有 一 个 相关 联 的 执 
行 线程 ， 该 执行 线程 现在 关联 至 新 创建 的 std::thread 对 象 。 否 则 ， 新 创建 的 
std: :thread 对 象 没 有 相关 联 的 执行 线程 。 

后 置 条 件 

对 新 构造 的 std::thread 对 象 x，x.get id O0 的 与 调用 构造 函数 前 
other.get id() 的 值 相等 。other.get id()--id(), 

引发 

X. 


iE std::thread Xf A Copyconstructible 的 ， 所 以 没有 拷贝 构造 函数 ， 只 有 这 个 
移动 构造 函数 。 ; 

std::thread 析 构 函数 
销毁 std::thread 对 象 。 


声明 


-thread(); 
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结果 

销毁 *this。 如 果 *this 拥有 相关 联 的 执行 线程 (this->joinable () 会 返回 
true)， 调 用 std: :terminate () 来 结束 程序 。 

引发 

无 。 


std::thread 移动 赋值 运算 符 


将 执行 线程 的 所 有 权 从 一 个 std: :thread 对 象 转 移 到 另 一 个 std: :thread 
对 象 。 

声明 
thread& operator-(thread&& other) noexcept; 

结果 

如 果 在 调用 之 前 this->joinable () 返 回 true, 调用 std::terminate () 来 
结束 程序 。 如 果 other 在 赋值 之 前 拥有 一 个 相关 联 的 执行 线程 ， 该 执行 线程 现在 关联 
Z*this, fil, *this 没有 相关 联 的 执行 线程 。 

后 置 条 件 

this-»get id() 与 调用 前 other.get_id() 的 值 相等 other .get_id()==iq() 。 

引发 

X5. 


ik std::thread 对 象 不 是 Copyconstructible 的 ， 所 以 没有 拷贝 赋值 运算 符 ， 只 有 这 
个 移动 赋值 运算 符 


std::thread::swap 成 员 函 数 


EPA std: : thread 对 象 之 间 交 换 它们 相关 的 执行 线程 的 所 有 权 。 

声明 
void swap(thread& other) noexcept; 

结果 

如 果 other 在 调用 之 前 拥有 一 个 相关 联 的 执行 线程 ， 该 执行 线程 现在 关联 至 
*this。 否 则 *this 没有 相关 联 的 执行 线程 。 如 果 *this 在 调用 之 前 拥有 一 个 相关 联 
的 执行 线程 ， 该 执行 线程 现在 关联 至 other。 否 则 other 没有 相关 联 的 执行 线程 。 

后 置 条 件 

this->get id() 与 调用 前 other.get id() 的 值 相等 ,other.get_ id() 与 调 
用 前 this->get_id() 的 值 相等 。 
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引发 
Jos 


swap 非 成 员 函 数 
在 两 个 std: : thread 对 象 之 间 交 换 它们 相关 的 执行 线程 的 所 有 权 。 


声明 

void swap(thread& lhs,thread& rhs) noexcept; 
结果 

lhs.swap(rhs) 


引发 
Js 


std::thread::joinable Ak F Eri 
查询 *this 是 否 拥有 关联 的 执行 线程 。 


声明 
bool joinable() const noexcept; 
返回 
如 果 *this 拥有 相关 联 的 执行 线程 ， 返 回 true, 否则 false, 
引发 
X. 


std::thread::join 成 员 函 数 
等 待 与 *this 相关 联 的 执行 线程 结束 。 
声明 
void join(); 
前 置 条 件 
this->joinable () 应 返回 true, 
结果 
阻塞 当前 线程 ， 直 到 与 *this 关联 的 执行 线程 结束 。 
后 置 条 件 
this-»get iqd()==id()。 在 调用 之 前 与 *this 关联 的 执行 线程 已 结束 。 
同步 
在 调用 前 与 *this 相关 联 的 执行 线程 执行 完毕 ， 发 生 于 对 join O 的 调用 返回 之 前 。 
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引发 
如 果 无 法 得 到 结果 , 或 者 this->joinable() 返 回 false, 引发 std::system_ 
error 异常 。 


std::thread::detach 成 员 函 数 
分 离 与 *this 相关 联 的 执行 线程 以 结束 。 


声明 
void detach(); 

前 置 条 件 

this-»joinable () 应 返回 true。 

结果 

分 离 与 *this 相关 联 的 执行 线程 。 

后 置 条 件 

this->get_id()==id(), this->joinable==false, 

在 调用 前 与 *this 相关 联 的 线程 被 分 离 ， 并 且 不 再 拥有 相关 联 的 std::thread 
对 象 。 

引发 

如 果 无 法 得 到 结果 ， 或 者 在 调用 时 this->joinable() 返 回 false， 引 发 
std::system error 异常 。 


std::thread::get id 成 员 函 数 


返回 标识 着 与 *this 关联 的 执行 线程 的 值 。 

声明 
thread::id get id() const noexcept; 

返回 

如 果 *this 拥有 相关 联 的 执行 线程 ， 返 回 标识 着 该 线程 的 std: :thread: :id 实 
例 。 否 则 返回 一 个 默认 构造 的 std: :thread: :id。 

引发 

无 。 


std::thread::hardware_concurrency 静态 成 员 函 数 


返回 在 当前 硬件 上 能 够 并 发 运行 的 线程 数目 的 提示 。 
声明 


unsigned hardware concurrency() noexcept; 
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返回 

在 当前 硬件 上 能 够 并 发 运行 的 线程 数目 。 例 如 ， 可 能 是 系统 中 处 理 器 的 数量 。 当 此 
信息 不 可 用 或 者 没有 妥善 定义 ， 函 数 返 回 0。 

引发 

无 。 


D.7.2 this thread 命名 空间 
std::this thread 命名 空间 中 的 函数 在 调用 线程 上 运行 。 
std::this_thread::get_id 非 成 员 函 数 


返回 一 个 std: :thread: :id 类 型 的 值 ， 标 识 当 前 的 执行 线程 。 
声明 
thread::id get id() noexcept; 
返回 
标识 当前 线程 的 一 个 std: :thread: :id 的 实例 。 
引发 
Jo. 


std::this thread::yield 非 成 员 函 数 


用 来 告知 类 库 ， 调 用 该 函数 的 线程 不 需要 在 调用 处 运行 。 通 常用 在 密集 的 循环 中 ， 
以 避免 消耗 过 多 的 CPU 时 间 。 

声明 
void yield() noexcept; 

结果 

为 类 库 提供 一 个 机 会 ， 可 以 调度 其 他 的 事情 来 替代 当前 线程 。 

引发 

Ti. 


std::this_thread::sleep_for 非 成 员 函 数 
将 当前 线程 的 执行 挂 起 一 段 指定 的 时 间 。 
声明 


template<typename Rep,typename Period» 
void sleep for(std::chrono::duration«Rep,Period» const& relative time); 


D.7 ”<thread> 头 文件 


结果 
阻塞 当前 线程 ， 直 到 指定 的 relative time 逝去 。 


ik 线程 可 能 会 比 指定 的 时 间 段 阻塞 更 久 。 如 果 可 能 的 话 ， 逝 去 时 间 应 由 匀速 时 钟 来 决定 。 
引发 
无 。 


std::this thread::sleep until 非 成 员 函 数 


挂 起 将 当前 线程 的 执行 ， 直 到 达到 指定 的 时 间 点 。 
声明 


template«typename Clock,typename Duration» 
void sleep until( 


std::chrono::time_point<Clock,Duration> const& absolute time); 
结果 
阻塞 当前 线程 ， 直 到 指定 的 Clock 达到 了 指定 的 absolute time, 


+ “没有 保证 调用 线程 会 被 阻塞 多 久 ， 除 非 Clock::now O 返回 的 时 间 等 于 或 者 晚 于 
absolute time 的 时 候 线程 才 会 解除 阻塞 。 
引发 
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具有 多 核 的 多 处 理 器 现 已 成 为 标 配 。C++ 语言 的 C++11 版 本 为 
多 线程 应 用 程序 提供 了 强大 的 支持 ， 你 需要 掌握 其 原理 、 技 巧 以 及 新 
的 并 发 语言 特性 ， 才 能 独 领 风 骚 。 


本 书 帮 助 你 循序 渐进 地 学 习 用 C++11 编写 健壮 且 优 雅 的 多 线程 
应 用 程序 。 你 将 学 习 线程 内 存 模型 、 新 的 线程 支持 库 ， 以 及 基础 的 线 
程 启动 和 同步 功能 。 与 此 同时 ， 你 还 将 学 到 如 何 解决 并 发 应 用 程序 中 
ROG IS] 


本 书 具 有 以 下 特色 : 

© 针对 C++11 新 标准 编写 代码 ; 

^ 针对 多 核 多 处 理 器 编写 程序 ; 

© 用 于 学 习 的 小 例子 ， 用 于 实践 的 大 例子 。 


本 书 适 合 新 接触 并 发 编程 的 C++ 程序 员 , 以 及 曾经 使 用 别 的 语言 、 
API 或 平台 编写 过 多 线程 代码 的 程序 员 阅 读 。 


作者 简介 : 
Anthony Williams 拥有 十 余年 的 C++ 经 验 ， 并 且 是 BSI C++ 
专家 组 的 成 员 。 
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